Cómo especificar una URL canónica con rel="canonical" y otros métodos

Para especificar una URL canónica para páginas duplicadas o muy similares a la Búsqueda de Google, puedes indicar tu preferencia mediante varios métodos, que aparecen a continuación, según la forma en la que pueden influir en la canonicalización:

Ten en cuenta que estos métodos se pueden apilar y, por lo tanto, ser más eficaces cuando se combinan. Por lo tanto, si usas dos o más métodos, aumentarás las posibilidades de que tu URL canónica preferida aparezca en los resultados de la búsqueda.

Si bien te recomendamos que utilices estos métodos, no es obligatorio hacerlo. Es probable que tu sitio funcione bien sin especificar una preferencia canónica, ya que si no especificas una URL canónica, Google identificará qué versión de la URL es objetivamente la mejor versión para mostrar a los usuarios en la Búsqueda.

Motivos para especificar una URL canónica

Si bien, por lo general, no es fundamental especificar una preferencia canónica para tus URLs, hay varios motivos por los que querrías informar a Google de forma explícita sobre una página canónica de un conjunto de páginas duplicadas o similares:

  • Para indicar la URL que quieres que se muestre en los resultados de la búsqueda. Es posible que prefieras que los usuarios lleguen a tu página de productos de vestidos verdes a través de https://www.example.com/dresses/green/greendress.html, en lugar de hacerlo por https://example.com/dresses/cocktail?gclid=ABCD.
  • Para consolidar los indicadores de las páginas similares o duplicadas. Es útil permitir que los motores de búsqueda agrupen los indicadores que tienen de diferentes URLs (por ejemplo, vínculos a ellas) en una única URL preferida. Esto significa que los indicadores de otros sitios a https://example.com/dresses/cocktail?gclid=ABCD se consolidan con vínculos a https://www.example.com/dresses/green/greendress.html si el último se convierte en canónico.
  • Para simplificar las métricas de seguimiento de un contenido. Con una variedad de URLs, puede ser más difícil obtener métricas consolidadas de un contenido específico.
  • Para ahorrar tiempo de rastreo en páginas duplicadas. Es posible que quieras que Googlebot aproveche al máximo el tiempo que pasa en tu sitio, por lo que es mejor que rastree las páginas nuevas (o actualizadas), en lugar de las versiones duplicadas del mismo contenido.

Prácticas recomendadas

En todos los métodos de canonicalización, sigue estas prácticas recomendadas:

  • No uses el archivo robots.txt con fines de canonicalización.
  • No especifiques una página canónica con la herramienta Eliminaciones, ya que se ocultarán todas las versiones de una URL de la Búsqueda.
  • No indiques varias URLs canónicas para una misma página con las diferentes técnicas de canonicalización (por ejemplo, no especifiques una URL en un mapa del sitio y otra URL de la misma página mediante rel="canonical").
  • No especifiques un fragmento de URL como canónico, ya que, por lo general, Google no admite fragmentos de URL.
  • No recomendamos usar noindex para evitar que se seleccione una página canónica de un solo sitio, ya que la bloqueará por completo de la Búsqueda. Las anotaciones derel="canonical" de link son la solución preferida.
  • Si usas hreflang elementos, asegúrate de especificar una página canónica en el mismo idioma o, en el caso de que no esté disponible en ese idioma, selecciona el que consideres más adecuado.
  • Cuando establezcas vínculos dentro de tu sitio, vincula a la URL canónica en lugar de a una duplicada. Usar de forma consistente la URL que consideras canónica ayuda a que Google comprenda tu elección.

Comparación de los métodos de canonicalización

En la siguiente tabla, se comparan los diferentes métodos de canonicalización y se destacan sus fortalezas y debilidades en relación con el mantenimiento y la eficacia en diferentes situaciones.

Método y descripción
Elemento rel="canonical" link

Agrega un elemento <link> al código de todas las páginas duplicadas que dirija a la página canónica.

Ventajas:
  • Permite mapear una cantidad infinita de páginas duplicadas.
Desventajas:
  • Puede resultar complicado mantener el mapeo en sitios grandes o en los que las URLs cambian con frecuencia.
  • Solo funciona en páginas HTML, no en archivos (por ejemplo, PDF). En esos casos, puede utilizarse el rel="canonical" encabezado HTTP.
Encabezado HTTP rel="canonical"

Envía un encabezado rel="canonical" en la respuesta de tu página.

Ventajas:
  • No aumenta el tamaño de la página.
  • Permite mapear una cantidad infinita de páginas duplicadas.
Desventajas:
  • Puede resultar complicado mantener el mapeo en sitios grandes o en los que las URLs cambian con frecuencia.
Mapa del sitio

Indica las páginas canónicas en un mapa del sitio.

Ventajas:

  • Es fácil de hacer y de mantener, especialmente en sitios grandes.

Desventajas:

  • Sin embargo, Google debe determinar las páginas duplicadas asociadas a las páginas canónicas que se declaran en el mapa del sitio.
  • El indicador que se envía a Google es más débil que el que se envía con la técnica de mapeo rel="canonical"
Redireccionamientos Usa redireccionamientos para indicarle a Googlebot que prefieres una URL de redireccionamiento en lugar de otra. Utiliza este método solo cuando des de baja a una página duplicada.
Variante de AMP Si una de las variantes es una página de AMP, sigue los lineamientos de AMP para indicar la página canónica y la variante de AMP.

Google admite anotaciones rel canonical link explícitas como se describe en RFC 6596. Las anotaciones rel="canonical" que sugieren que se ignoran versiones alternativas de una página específicamente, anotaciones rel="canonical" con los atributos hreflang, lang, media y type no se usan para canonicalización. En su lugar, usa las anotaciones link adecuadas para especificar versiones de una página; por ejemplo, link rel="alternate" hreflang para anotaciones de idioma y país.

Puedes proporcionar las anotaciones rel="canonical" link de dos maneras:

Te recomendamos que elijas una de estas opciones. Si bien se admite, el uso de ambos métodos al mismo tiempo, es más propenso a errores (por ejemplo, puedes proporcionar una URL en el encabezado HTTP y otra URL en el elemento rel="canonical" link).

Un elemento rel="canonical" link (también conocido como elemento canónico) es un elemento que se usa en la sección head de HTML para indicar que otra página es representativa del contenido de la página.

Supongamos que, aunque se pueda acceder al contenido desde varias URL, quieres que https://example.com/dresses/green-dresses sea la canónica. Para marcar esa URL como canónica, sigue estos pasos:

  1. Agrega un elemento <link> con el atributo rel="canonical" a la sección <head> de páginas duplicadas, que dirija a la página canónica. Por ejemplo:
    <html>
    <head>
    <title>Explore the world of dresses</title>
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
    <!-- other elements -->
    </head>
    <!-- rest of the HTML -->
  2. Si la página canónica tiene una variante para dispositivos móviles en una URL independiente, agrega un elemento rel="alternate" link que dirija a esa versión de la página:
    <html>
    <head>
    <title>Explore the world of dresses</title>
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="https://m.example.com/dresses/green-dresses">
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
    <!-- other elements -->
    </head>
    <!-- rest of the HTML -->
  3. Agrega cualquier elemento hreflang o cualquier otro elemento que sea adecuado para la página.

Usa rutas de acceso absolutas en lugar de relativas con el elemento rel="canonical" link. Aunque las rutas de acceso relativas son compatibles con Google, pueden causar problemas a largo plazo (por ejemplo, si permites que se rastree tu punto de toma de muestras de manera no intencional) y, por lo tanto, no las recomendamos.

Buen ejemplo: https://www.example.com/dresses/green/greendress.html

Mal ejemplo: /dresses/green/greendress.html

rel="canonical" link element solo se acepta si aparece en la sección <head> del código HTML, por lo que debes asegurarte de que al menos la sección <head> sea un código HTML válido.

Si usas JavaScript para agregar el elemento link de rel="canonical", asegúrate de insertar el elemento de vínculo canónico correctamente.

El encabezado HTTP rel="canonical"

Si puedes cambiar la configuración de tu servidor, puedes usar un link Encabezado de respuesta HTTP con un atributo de destino rel="canonical", como se define en RFC5988 en lugar de un elemento HTML para indicar la URL canónica de un documento compatible por Búsqueda, incluidos los documentos que no sean documentos HTML, como los archivos PDF.

Google solo admite este método en los resultados de la búsqueda web.

Si publicas contenido en muchos formatos de archivo, como PDF o Microsoft Word, cada uno en su propia URL, puedes mostrar un encabezado HTTP rel="canonical" para indicarle a Googlebot cuál es la URL canónica de la página de archivos que no son HTML. Por ejemplo, para indicar que la versión en PDF de la versión .docx debe ser canónica, puedes agregar este encabezado HTTP para la versión .docx del contenido:

HTTP/1.1 200 OK
Content-Length: 19
...
Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical"
...

Al igual que con el elemento rel="canonical" link, usa URLs absolutas en el encabezado HTTP rel="canonical" y, según RFC2616, usa solo comillas dobles en torno a la URL.

Usa un mapa del sitio

Elige una URL canónica para cada página de tu sitio y envíalas en un mapa del sitio. Todas las páginas incluidas en un mapa del sitio se sugieren como canónicas (si hay páginas duplicadas, Google decidirá cuáles son en función de la similitud del contenido).

El suministro de URLs canónicas preferidas en los mapas del sitio es una manera simple de definir las páginas canónicas de un sitio grande, y estos son una forma útil de indicarle a Google qué páginas consideras más importantes.

Usa redireccionamientos

Utiliza este método cuando quieras deshacerte de las páginas duplicadas que tengas. Todos los métodos de redireccionamiento (301 y 302, meta-refresh y los redireccionamientos de JavaScript) tienen el mismo efecto en la Búsqueda de Google. Sin embargo, el tiempo que tardan los motores de búsqueda en notar los diferentes métodos de redireccionamiento pueden variar.

Para el efecto más rápido, usa redireccionamientos 3xx HTTP (también conocidos como del servidor) .

Supongamos que se puede acceder a tu página de varias maneras:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Selecciona una de esas URLs como canónica y usa redireccionamientos para dirigir el tráfico de las otras URLs a la preferida.

Otros indicadores

Además de los métodos proporcionados de forma explícita, Google también usa un conjunto de indicadores de canonicalización que, por lo general, se basan en la configuración del sitio: se prefiere HTTPS en lugar de HTTP y las URLs en los clústeres hreflang.

Usa HTTPS y no HTTP para URLs canónicas

Google prefiere que se marquen como canónicas páginas HTTPS en lugar de sus equivalentes HTTP, a menos que se produzca alguno de los siguientes problemas o indicadores contradictorios:

  • La página HTTPS tiene un certificado SSL no válido.
  • La página HTTPS contiene dependencias que no son seguras (y no son imágenes).
  • La página HTTPS redirecciona a los usuarios a una página HTTP o hace que pasen por una página de este tipo.
  • La página HTTPS tiene un rel="canonical" link que dirige a la página HTTP.

Si bien nuestros sistemas prefieren las páginas HTTPS a las HTTP de forma predeterminada, para asegurarte de que así sea, realiza cualquiera de las siguientes acciones:

  • Agrega redireccionamientos de las páginas HTTP a las páginas HTTPS.
  • Agrega un rel="canonical" link de la página HTTP a las páginas HTTPS.
  • Implementa HSTS.

Para evitar que Google marque de forma incorrecta la versión HTTP de una página como canónica, evita las siguientes prácticas:

  • Usar certificados TLS/SSL incorrectos o incluir redireccionamientos de HTTPS a HTTP. Cuando se detecta una de esas prácticas, Google prefiere usar la versión HTTP. Implementar HSTS no anula esta preferencia.
  • No incluyas la versión HTTP de tus páginas en tu mapa del sitio ni las anotaciones hreflang, en lugar de la versión HTTPS.
  • Evita implementar tu certificado SSL/TLS para la variante de host incorrecta. Por ejemplo, example.com entrega el certificado de subdomain.example.com. El certificado debe coincidir con la URL del sitio completa, o bien debe tratarse de un certificado comodín que pueda usarse en varios subdominios de un dominio.

Preferir URLs en clústeres hreflang

A fin de facilitar las tareas de localización de los sitios, Google recomienda las URLs que forman parte de los clústeres hreflang para fines de canonicalización. Por ejemplo, si https://example.com/de-de/cats y https://example.com/de-ch/cats se apuntan mutuamente con anotaciones hreflang, pero no apuntan a https://example.com/de-at/cats, las páginas de de-de y de-ch se preferirán como canónicas en lugar de /de-at/ que no aparecen en el clúster hreflang.

Obtén más información para solucionar problemas y corregir errores de canonicalización.