Como especificar um URL canônico com rel="canonical" e outros métodos

Para especificar um URL canônico de páginas duplicadas ou muito semelhantes à Pesquisa Google, você pode indicar sua preferência usando vários métodos. Confira cada um deles em ordem de capacidade de influenciar a canonização:

Esses métodos podem se acumular e são mais eficazes quando combinados. Portanto, o uso de dois ou mais métodos aumenta a chance de seu URL canônico de preferência aparecer nos resultados da pesquisa.

Embora seja recomendado usar esses métodos, nenhum deles é necessário. Seu site provavelmente vai funcionar bem sem especificar uma preferência canônica. Isso ocorre porque, se você não especificar um URL canônico, o Google vai identificar qual versão do URL é a melhor para mostrar aos usuários na Pesquisa.

Motivos para especificar um URL canônico

Embora geralmente não seja essencial especificar uma preferência canônica para seus URLs, há vários motivos para informar ao Google explicitamente sobre uma página canônica em um conjunto de páginas duplicadas ou semelhantes:

  • Para especificar o URL que será visto pelas pessoas nos resultados da pesquisa: Talvez você prefira que as pessoas cheguem à página de vestidos verdes usando https://www.example.com/dresses/green/greendress.html em vez de https://example.com/dresses/cocktail?gclid=ABCD.
  • Para consolidar indicadores em páginas semelhantes ou duplicadas. Isso ajuda os mecanismos de pesquisa a consolidar os indicadores que eles têm de URLs individuais (como links) em um único URL preferencial. Isso significa que os indicadores de outros sites para https://example.com/dresses/cocktail?gclid=ABCD vão ser consolidados com links para https://www.example.com/dresses/green/greendress.html se o último se tornar canônico.
  • Para simplificar as métricas de rastreamento de um conteúdo. Com URLs variados, pode ser mais difícil consolidar métricas de um tipo de conteúdo específico.
  • Para poupar tempo de rastreamento em páginas duplicadas. Talvez você queira que o Googlebot aproveite ao máximo seu site. Por isso, é melhor investir tempo em rastrear páginas novas ou atualizadas no site, em vez de versões duplicadas do mesmo conteúdo.

Práticas recomendadas

Para todos os métodos de canonização, siga estas práticas recomendadas:

  • Não use o arquivo robots.txt para fins de canonização.
  • Não use a Ferramenta de remoção de URL para canonização, porque ela oculta todas as versões de um URL da Pesquisa.
  • Não especifique URLs diferentes como versões canônicas da mesma página usando uma ou mais técnicas de canonização. Por exemplo, não especifique um URL no sitemap e indique outro URL para essa mesma página usando rel="canonical".
  • Não especifique um fragmento de URL como canônico, já que o Google geralmente não oferece suporte a fragmentos de URL.
  • Não recomendamos usar noindex para impedir a seleção de uma página canônica em um único site, porque isso vai bloquear completamente a página da Pesquisa. Anotações rel="canonical" link são a solução preferida.
  • Se você usar elementos hreflang, especifique uma página canônica no mesmo idioma ou no melhor substituto possível caso não haja uma página canônica no mesmo idioma.
  • Ao criar links no seu site, use o URL canônico em vez de um URL duplicado. Vincular o site consistentemente ao URL que você considera canônico ajuda o Google a entender sua preferência.

Comparação de métodos de canonização

A tabela a seguir compara os diferentes métodos de canonização, destacando seus pontos fortes e fracos em relação à manutenção e à eficácia em diferentes cenários.

Método e descrição
Elemento rel="canonical" link

Adicione um elemento <link> ao código de todas as páginas duplicadas indicando a página canônica.

Vantagens:
  • É possível mapear um número infinito de páginas duplicadas.
Desvantagens:
  • Pode tornar complexa a manutenção do mapeamento em sites maiores ou sites em que os URLs mudam com frequência.
  • Só funciona para páginas HTML, não para arquivos como PDF. Nesses casos, use o cabeçalho HTTP rel="canonical".
Cabeçalho HTTP rel="canonical"

Envie um cabeçalho rel="canonical" na resposta da sua página.

Vantagens:
  • Não aumenta o tamanho da página.
  • É possível mapear um número infinito de páginas duplicadas.
Desvantagens:
  • Pode tornar complexa a manutenção do mapeamento em sites maiores ou sites em que os URLs mudam com frequência.
Sitemap

Especifique suas páginas canônicas em um Sitemap.

Vantagens:

  • Fácil de fazer e manter, especialmente em sites grandes.

Desvantagens:

  • O Google ainda precisa determinar a cópia associada a cada página canônica que você declarar no sitemap.
  • É um indicador menos eficaz para o Google do que o método de mapeamento rel="canonical".
Redirecionamentos Use os redirecionamentos para informar ao Googlebot que um URL redirecionado é uma versão melhor que a de outro. Use essa opção somente quando descontinuar uma página duplicada.
Variante AMP Se uma das suas variantes for uma página AMP, siga as diretrizes de AMP para indicar a página canônica e a variante AMP.

O Google oferece suporte a anotações rel canonical link com linguagem explícita conforme descrito na RFC 6596. As anotações rel="canonical" que sugerem versões alternativas de uma página são ignoradas; Especificamente, anotações rel="canonical" com atributos hreflang, lang, media e type não são usadas para canonização. Em vez disso, use as anotações link apropriadas para especificar versões alternativas de uma página; Por exemplo, link rel="alternate" hreflang para anotações de idioma e país.

É possível incluir anotações rel="canonical" link de duas maneiras:

Recomendamos que você escolha uma das opções compatíveis. O uso dos dois métodos ao mesmo tempo é mais propenso a erros. Por exemplo, talvez você inclua um URL no cabeçalho HTTP e outro no elemento rel="canonical" link.

O elemento rel="canonical" link (também conhecido como elemento canônico) é usado na seção head do HTML para indicar que outra página representa o conteúdo na página.

Suponha que você queira que https://example.com/dresses/green-dresses seja o URL canônico, mesmo que vários URLs possam acessar esse conteúdo. Siga estas etapas para indicar esse URL como canônico:

  1. Adicione um elemento <link> com o atributo rel="canonical" à seção <head> de páginas repetidas para direcionar o usuário à página canônica. Exemplo:
    <html>
    <head>
    <title>Explore the world of dresses</title>
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
    <!-- other elements -->
    </head>
    <!-- rest of the HTML -->
  2. Se a página canônica tiver uma variante para dispositivos móveis em um URL separado, adicione um elemento rel="alternate" link a ela e direcione o usuário à versão da página para dispositivos móveis:
    <html>
    <head>
    <title>Explore the world of dresses</title>
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="https://m.example.com/dresses/green-dresses">
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
    <!-- other elements -->
    </head>
    <!-- rest of the HTML -->
  3. Adicione hreflang ou outros elementos adequados à página.

Use caminhos absolutos em vez de relativos com o elemento rel="canonical" link. Embora o Google aceite caminhos relativos, eles podem causar problemas em longo prazo, por exemplo, se você permitir que o site de teste seja rastreado acidentalmente. Portanto, esse recurso não é recomendável.

Exemplo adequado: https://www.example.com/dresses/green/greendress.html

Exemplo ruim: /dresses/green/greendress.html

O elemento rel="canonical" link element só vai ser aceito se aparecer na seção <head> do HTML. Portanto, confira se pelo menos a seção <head> é um HTML válido.

Se você usar JavaScript para adicionar o elemento rel="canonical" link, injete o elemento de link canônico corretamente.

Cabeçalho HTTP rel="canonical"

Se for possível mudar a configuração do servidor, use um link Cabeçalho de resposta HTTP com um atributo de destino rel="canonical", conforme definido pela RFC5988 em vez de um elemento HTML para indicar o URL canônico de um documento compatível com a Pesquisa, incluindo documentos não HTML, como arquivos PDF.

O Google aceita esse método somente para resultados da pesquisa na Web.

Caso publique conteúdo em vários formatos de arquivo, como PDF ou Microsoft Word, cada um em um URL próprio, você pode retornar um cabeçalho HTTP rel="canonical" para informar ao Googlebot qual é o URL canônico dos arquivos que não são HTML. Por exemplo, para indicar que a versão em PDF de .docx precisa ser canônica, adicione este cabeçalho HTTP à versão .docx do conteúdo:

HTTP/1.1 200 OK
Content-Length: 19
...
Link: <https://www.example.com/downloads/white-paper.pdf>; rel="canonical"
...

Assim como no elemento rel="canonical" link, use URLs absolutos no cabeçalho HTTP rel="canonical" e, de acordo com a RFC2616, use apenas aspas duplas ao redor do URL.

Usar um sitemap

Escolha um URL canônico para cada uma das páginas e os envie em um sitemap. Todas as páginas listadas no sitemap são sugeridas como canônicas. O Google decide quais páginas são duplicadas (se houver alguma) com base na semelhança do conteúdo.

Informar os URLs canônicos preferenciais nos sitemaps é uma maneira simples de definir a página canônica para um site grande. Além disso, os sitemaps são úteis para informar ao Google quais páginas você considera mais importantes.

Use redirecionamentos

Use esse método quando quiser se desfazer de páginas duplicadas. Todos os métodos de redirecionamento (301, 302, meta-refresh e JavaScript) têm o mesmo efeito na Pesquisa Google, mas o tempo necessário para que os mecanismos de pesquisa observem os diferentes métodos de redirecionamento pode diferir.

Para aplicar o efeito mais rápido, use redirecionamentos HTTP 3xx, também conhecidos como do lado do servidor.

Digamos que sua página possa ser encontrada de várias maneiras:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

Escolha um desses URLs como canônico e use redirecionamentos para enviar o tráfego dos outros URLs para o URL preferencial.

Outros indicadores

Além dos métodos informados, o Google também usa um conjunto de indicadores de canonização que geralmente são baseados na configuração do site: preferência por HTTPS em vez de HTTP e URLs em clusters hreflang.

Dar preferência ao uso de HTTPS em vez de HTTP para URLs canônicos

O Google dá preferência a páginas HTTPS em vez das equivalentes em HTTP como canônicas, exceto quando há problemas ou indicadores conflitantes, como os seguintes:

  • A página HTTPS tem um certificado SSL inválido.
  • A página HTTPS contém dependências não seguras (que não são imagens).
  • A página HTTPS redireciona os usuários para ou por uma página HTTP.
  • A página HTTPS tem um rel="canonical" link para a página HTTP.

Por padrão, nossos sistemas preferem as páginas HTTPS às HTTP, mas você pode tomar algumas medidas para garantir esse comportamento:

  • Adicionar redirecionamentos da página HTTP para a página HTTPS
  • Adicionar um rel="canonical" link da página HTTP para a página HTTPS
  • Implementar HSTS

Para impedir que o Google canonize incorretamente uma página HTTP, evite as seguintes práticas:

  • Evite usar certificados TLS/SSL inválidos e redirecionamentos de HTTPS para HTTP, já que eles fazem com que o Google tenha uma preferência muito maior por páginas HTTP. Implementar o HSTS não muda essa preferência.
  • Não inclua a versão HTTP das páginas no sitemap ou nas anotações hreflang em vez da versão HTTPS.
  • Evite implementar seu certificado SSL/TLS para a variante errada do host. Por exemplo, example.com exibindo o certificado para subdomain.example.com. O certificado precisa ser o mesmo do URL completo do site ou ser um certificado curinga que pode ser usado para vários subdomínios em um domínio.

Preferir URLs em clusters hreflang

Para ajudar na localização dos sites, o Google dá preferência a URLs que fazem parte de clusters hreflang para fins de canonização. Por exemplo, se https://example.com/de-de/cats e https://example.com/de-ch/cats apontarem reciprocamente um para o outro com anotações hreflang, mas não para https://example.com/de-at/cats, as páginas de de-de e de-ch vão ter preferência como versões em vez da página /de-at/, que não aparece no cluster hreflang.

Saiba mais sobre como resolver problemas de canonização.