Prácticas recomendadas para la estructura de las URLs en la Búsqueda de Google
Para asegurarte de que la Búsqueda de Google pueda rastrear tu sitio de manera eficaz, usa una estructura de URL rastreable que cumpla con los siguientes requisitos. Si tus URLs no cumplen con los siguientes criterios, es probable que la Búsqueda de Google rastree tu sitio de manera ineficiente, lo que incluye, sin limitaciones, tasas de rastreo extremadamente altas o que no se rastree en absoluto.
Requisitos para una estructura de URL rastreable | |||||||
---|---|---|---|---|---|---|---|
Sigue el IETF STD 66 |
La Búsqueda de Google admite las URLs, según lo que define el IETF STD 66. Los caracteres que el estándar define como reservados deben estar codificados en porcentajes. |
||||||
No uses fragmentos de URL para cambiar el contenido |
No uses fragmentos para cambiar el contenido de una página, ya que, por lo general, la Búsqueda de Google no admite fragmentos de URL. Este es un ejemplo de un fragmento de URL: https://example.com/#/potatoes Si usas JavaScript para cambiar el contenido, usa la API de History en su lugar. |
||||||
Usa una codificación común para los parámetros de URL |
Cuando especifiques los parámetros de URL, usa la siguiente codificación común: un signo igual
(
|
Facilita la comprensión de la estructura de tu URL
Para ayudar a la Búsqueda de Google (y a los usuarios) a comprender mejor tu sitio, te recomendamos que crees una estructura de URL simple y que apliques las siguientes prácticas recomendadas siempre que sea posible.
Prácticas recomendadas | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Usa URLs descriptivas |
Cuando sea posible, usa palabras legibles en las URLs en lugar de números de ID largos.
|
||||||||||
Usa el idioma de tu público |
Usa palabras en el idioma de tu público en la URL (y, si corresponde, palabras transliteradas). Por ejemplo, si tu público realiza búsquedas en alemán, usa palabras en alemán en la URL: https://example.com/lebensmittel/pfefferminz O, si tu público realiza búsquedas en japonés, usa palabras en japonés en la URL: https://example.com/ペパーミント |
||||||||||
Usa la codificación UTF-8 según sea necesario. |
Cuando establezcas vínculos a páginas de tu sitio,
usa la codificación UTF-8 en los atributos
|
||||||||||
Usa guiones para separar palabras |
Te recomendamos que separes las palabras en tus URLs, siempre que sea posible. Específicamente, te recomendamos que uses
guiones (
|
||||||||||
Usa la menor cantidad posible de parámetros |
Siempre que sea posible, acorta las URLs con el recorte de parámetros innecesarios (es decir, parámetros que no cambian el contenido). | ||||||||||
Ten en cuenta que las URLs distinguen mayúsculas de minúsculas. |
Al igual que cualquier otro cliente HTTP que siga el estándar IETF STD 66, el manejo de URLs de la Búsqueda de Google distingue mayúsculas de minúsculas (por ejemplo, Google trata /APPLE y /apple como
URLs distintas con su propio contenido). Si el servidor web trata de
la misma manera el texto en mayúsculas y en minúsculas de una URL, conviértelo al mismo tipo de letra de modo que Google
pueda determinar más fácilmente que las URL hacen referencia a la misma página.
|
||||||||||
Para sitios multirregionales |
Si tu sitio es multirregional, procura usar una estructura de URL que facilite la segmentación geográfica. Para ver más ejemplos de cómo estructurar las URLs, consulta Usa URLs específicas de configuración regional. Se recomienda (con un dominio específico por país): https://example.de Se recomienda (con un subdirectorio específico por país con gTLD): https://example.com/de/ |
Evita problemas habituales relacionados con las URLs
Las URLs demasiado complejas, en especial aquellas que contienen varios parámetros, pueden causar problemas a los rastreadores, ya que crean cantidades excesivas e innecesarias de URLs que dirigen a contenido idéntico o similar en tu sitio. Como resultado, es posible que Googlebot consuma mucho más ancho de banda de lo necesario o que la Búsqueda de Google no pueda indexar por completo todo el contenido de tu sitio.
Existen diferentes motivos por los que podrías tener una cantidad excesiva e innecesaria de URL. Esos eventos incluyen los siguientes:
Problemas comunes | |
---|---|
Filtrado aditivo de un conjunto de elementos. |
Muchos sitios proporcionan diferentes vistas del mismo conjunto de elementos o de resultados de la búsqueda, lo que suele permitir que el usuario filtre este conjunto mediante criterios definidos (por ejemplo: muéstrame hoteles en la playa). Cuando los filtros pueden combinarse de manera aditiva (por ejemplo, hoteles en la playa y con gimnasio), la cantidad de URL (vistas de datos) de los sitios crece exponencialmente. Crear muchas listas de hoteles levemente diferentes resulta redundante, ya que Googlebot solo necesita ver una pequeña cantidad de ellas para llegar a la página de cada hotel. Por ejemplo:
|
Parámetros irrelevantes |
Los parámetros irrelevantes en la URL pueden generar una gran cantidad de URLs, como las siguientes:
Considera usar un archivo robots.txt para bloquear el acceso de Googlebot a estas URLs problemáticas. |
Problemas con el calendario |
Es posible que un calendario generado de forma dinámica cree vínculos a fechas futuras y anteriores sin restringir las fechas de inicio y finalización. Por ejemplo: https://example.com/calendar.php?d=13&m=8&y=2011
Si tu sitio tiene un calendario infinito, agrega un atributo |
Vínculos relacionados rotos. |
Si colocas un vínculo relativo a la página superior
en la página incorrecta, es posible que se creen espacios infinitos si tu servidor no responde con el código de estado HTTP correcto
para las páginas que no existen. Por ejemplo, un vínculo relativo a la parte superior, como
<a href="../../category/stuff">...</a> en https://example.com/category/community/070413/html/FAQ.htm ,
puede generar URLs falsas, como https://example.com/category/community/category/stuff .
Para solucionarlo, usa URLs relativas a la raíz en tus vínculos (en lugar de relativas a la página superior).
|
Cómo corregir problemas relacionados con la estructura de la URL de rastreo
Si observas que la Búsqueda de Google rastrea estas URLs problemáticas, te recomendamos que hagas lo siguiente:
- Considera usar un archivo robots.txt para bloquear el acceso de Googlebot a las URLs problemáticas. Por lo general, considera bloquear las URLs dinámicas, como las que generan resultados de las búsquedas, o aquellas que pueden crear espacios infinitos, como los calendarios, y las funciones de ordenamiento y filtrado.
- Si tu sitio tiene navegación por facetas, obtén más información para administrar el rastreo de esas URLs de navegación por facetas.