Prácticas recomendadas para la estructura de las URLs en Google
Google admite las URLs, según lo que define la RFC 3986. Los caracteres que el estándar define como reservados deben estar codificados en porcentajes. Los caracteres ASCII sin reserva pueden dejarse en un formato no codificado. Además, los caracteres en el rango que no es ASCII deben estar codificados en UTF-8.
Cuando sea posible, usa palabras legibles en las URLs en lugar de números de ID largos.
Recomendación: Palabras simples y descriptivas en la URL:
https://en.wikipedia.org/wiki/Aviation
Recomendación: Palabras localizadas en la URL, si corresponde.
https://example.com/lebensmittel/pfefferminz
Recomendación: Usa la codificación UTF-8 según sea necesario. En el siguiente ejemplo, se usa la codificación UTF-8 para caracteres árabes en la URL:
https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
En el siguiente ejemplo, se usa la codificación UTF-8 para caracteres chinos en la URL:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
En el siguiente ejemplo, se usa la codificación UTF-8 para la diéresis en la URL:
https://example.com/gem%C3%BCse
En el siguiente ejemplo, se usa la codificación UTF-8 para emojis en la URL:
https://example.com/%F0%9F%A6%99%E2%9C%A8
No se recomienda usar caracteres que no sean ASCII en la URL:
https://example.com/نعناع
https://example.com/杂货/薄荷
https://example.com/gemüse
https://example.com/🦙✨
No se recomienda usar números de ID largos e ilegibles en la URL:
https://example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
No uses fragmentos para cambiar el contenido de una página, ya que, por lo general, Google no admite fragmentos de URLs. Si usas JavaScript para cambiar el contenido, usa la API de History en su lugar.
No se recomienda usar fragmentos de URLs:
https://example.com/#/potatoes
Si tu sitio es multirregional, procura usar una estructura de URL que facilite la segmentación geográfica de tu sitio. Para ver más ejemplos de cómo estructurar las URLs, consulta Usa URLs específicas de configuración regional.
Recomendación: Dominio específico por país:
https://example.de
Se recomienda el uso de subdirectorios específicos por país con gTLD:
https://example.com/de/
Considera usar guiones para separar las palabras en tus URLs, ya que eso ayuda a los usuarios y a los motores de búsqueda a identificar conceptos en ellas con mayor facilidad. Te recomendamos que uses guiones (-
) en lugar de guiones bajos (_
) en tus URLs.
Se recomienda el uso de guiones (-
):
https://example.com/summer-clothing/filter?color-profile=dark-grey
No se recomienda el uso de guiones bajos (_
):
https://example.com/summer_clothing/filter?color_profile=dark_grey
No se recomienda el uso de palabras en la URL sin separación alguna, por ejemplo:
https://example.com/greendress
Cuando especifiques los parámetros de URL, usa la siguiente codificación común: un signo igual (=
)
para separar los pares clave-valor y agrega parámetros adicionales con un signo & (&
).
Para enumerar varios valores para la misma clave dentro de un par clave-valor, puedes usar cualquier carácter que
no entre en conflicto con el estándar IETF STD 66,
como una coma (,
).
Se recomienda usar un signo igual
(=
) para separar los pares clave-valor y un signo & (&
) para agregar
parámetros adicionales:
https://example.com/category?category=dresses&sort=low-to-high&sid=789
Se recomienda usar una coma
(,
) para enumerar varios valores de la misma clave, un signo igual (=
) para
separar los pares clave-valor y un signo & (&
) para agregar parámetros adicionales:
https://example.com/category?category=dresses&color=purple,pink,salmon&sort=low-to-high&sid=789
No se recomienda usar dos puntos
:
para separar los pares clave-valor y corchetes [ ]
para agregar parámetros
adicionales
https://example.com/category?[category:dresses][sort:price-low-to-high][sid:789]
No se recomienda usar una sola coma
,
para separar los pares clave-valor y comas dobles ,,
para agregar parámetros
adicionales
https://example.com/category?category,dresses,,sort,lowtohigh,,sid,789
Problemas habituales relacionados con las URLs
Las URLs demasiado complejas, en especial aquellas que contienen varios parámetros, pueden causar problemas a los rastreadores, ya que crean cantidades excesivas e innecesarias de URLs que dirigen a un contenido idéntico o similar en tu sitio. Como resultado, es posible que Googlebot consuma mucho más ancho de banda de lo necesario o que no pueda indexar por completo todo el contenido de tu sitio.
Existen diferentes motivos por los que podrías tener una cantidad excesiva e innecesaria de URLs. Entre esos eventos, se incluyen los siguientes:
- Filtrado aditivo de un conjunto de elementos. Muchos sitios proporcionan diferentes vistas del mismo conjunto de elementos o de resultados de la búsqueda, lo que suele permitir que el usuario filtre este conjunto mediante criterios definidos (por ejemplo: muéstrame hoteles en la playa). Cuando los filtros pueden combinarse de manera aditiva (por ejemplo, hoteles en la playa y con gimnasio), la cantidad de URLs (vistas de datos) de los sitios crece exponencialmente. Crear muchas listas de hoteles levemente diferentes resulta redundante, ya que Googlebot solo necesita ver una pequeña cantidad de ellas para llegar a la página de cada hotel. Por ejemplo:
- Propiedades de hoteles por "tarifa":
https://example.com/hotel-search-results.jsp?Ne=292&N=461
- Propiedades de hoteles por "tarifa" en la playa:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- Propiedades de hoteles por "tarifa" en la playa y con gimnasio:
https://example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- Propiedades de hoteles por "tarifa":
- Generación dinámica de documentos. Esto puede provocar cambios pequeños debido a anuncios, contadores o marcas de tiempo.
- Parámetros problemáticos en la URL: Los IDs de sesión, por ejemplo, pueden crear enormes cantidades de duplicación y una mayor cantidad de URLs.
-
Parámetros de ordenamiento: Algunos sitios de compras grandes ofrecen varias maneras de ordenar los mismos artículos, lo que resulta en una gran cantidad de URLs. Por ejemplo:
https://example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- Parámetros irrelevantes en la URL, como los parámetros de referencia: Por ejemplo:
https://example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- Problemas con el calendario: Es posible que un calendario generado de forma dinámica cree vínculos a fechas futuras y anteriores sin restringir las fechas de inicio y de finalización. Por ejemplo:
https://example.com/calendar.php?d=13&m=8&y=2011
- Vínculos relacionados rotos. Los vínculos relacionados rotos a menudo pueden causar espacios infinitos. Con frecuencia, este problema se presenta debido a la repetición de elementos de ruta de acceso. Por ejemplo:
https://example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
Cómo resolver problemas relacionados con las URLs
A fin de evitar posibles problemas con la estructura de una URL, te recomendamos que hagas lo siguiente:
- Crea una estructura de URL simple. Procura organizar tu contenido de manera que las URLs se construyan de forma lógica y sean comprensibles para los seres humanos.
- Usa un archivo robots.txt para bloquear el acceso de Googlebot a las URLs problemáticas. Como regla general, considera bloquear las URLs dinámicas, como las que generan resultados de las búsquedas, o aquellas que pueden crear espacios infinitos, como los calendarios. Si usas expresiones regulares en el archivo robots.txt, podrás bloquear fácilmente grandes cantidades de URLs.
- Cuando sea posible, evita el uso de IDs de sesión en las URLs y considera usar cookies en su lugar.
- Si el servidor web trata de la misma manera el texto en mayúsculas y en minúsculas de una URL, conviértelo al mismo tipo de letra, de modo que Google pueda determinar más fácilmente que las URLs hacen referencia a la misma página.
- Siempre que sea posible, acorta las URLs con el recorte de parámetros innecesarios.
-
Si tu sitio tiene un calendario infinito, agrega un atributo
nofollow
a los vínculos que dirigen a páginas de calendario futuras creadas de forma dinámica. - Revisa tu sitio para comprobar si hay vínculos relacionados que no funcionan.