Cinco erros comuns no uso de rel=canonical

Segunda-feira, 8 de abril de 2013

Incluir um rel=canonical link na sua página da Web é uma boa dica para os mecanismos de pesquisa usarem a versão de sua preferência para indexar páginas duplicadas na Web. Ele é aceito por vários mecanismos de pesquisa, incluindo Yahoo!, Bing e Google. O link rel=canonical consolida as propriedades de indexação das páginas duplicadas, como os links de entrada, e especifica qual URL você quer exibir nos resultados da pesquisa. No entanto, rel=canonical pode ser um pouco complicado porque não é muito óbvio quando há uma configuração incorreta.

Exemplo de uma página e sua marcação HTML para rel-canonical.

Embora o webmaster veja a página "red velvet" à esquerda no navegador, os mecanismos de pesquisa processam o rel=canonical não intencional de "blue velvet" do webmaster à direita. Recomendamos as seguintes práticas recomendadas para usar rel=canonical:

  • Grande parte do conteúdo das páginas duplicadas deve estar presente na versão canônica.
  • Verifique se o destino rel=canonical existe e que não seja um erro ou "soft 404".
  • Verifique se o destino do rel=canonical não contém uma meta tag robots noindex.
  • Prefira que o URL rel=canonical seja exibido nos resultados da pesquisa em vez do URL duplicado.
  • Inclua o link rel=canonical no <head> da página ou no cabeçalho HTTP.
  • Especifique no máximo um rel=canonical por página. Quando mais de um é especificado, todos os links rel=canonical são ignorados.

Primeiro erro: rel=canonical na primeira página de uma série paginada

Imagine que você tem um artigo que se estende por várias páginas:

  • example.com/article?story=cupcake-news&page=1
  • example.com/article?story=cupcake-news&page=2
  • e assim por diante.

Especificar um rel=canonical da página 2 (ou de qualquer página posterior) para a página 1 não faz uso correto de rel=canonical, já que essas páginas não são duplicadas. O uso de rel=canonical nesse caso resultaria na não indexação do conteúdo da página 2 e das páginas posteriores.

Exemplo de marcações rel-canonical incorretas.
Conteúdo de qualidade, como “biscoitos têm mais nutrientes que” e “os vegetais”, é perdido ao especificar rel=canonical no componente à primeira página de uma série.
Exemplo de anotação de uma série de páginas com rel-canonical que leva a uma única página com todo o conteúdo da série.
rel=canonical de páginas de componentes para a página de exibição total
Exemplo de anotação de páginas com rel-canonical e as anotações rel-prev-next descontinuadas.
Se rel=canonical a uma página de exibição total não estiver designado, um conteúdo paginado poderá usar a marcação rel="prev" e rel="next".

Segundo erro: URLs absolutos escritos incorretamente como URLs relativos

Exemplo de marcação rel-canonical incorreta: URLs relativos errados

A tag <link>, como muitas tags HTML, aceita URLs relativos e absolutos. Os URLs relativos incluem um caminho "relative" para a página atual. Por exemplo, images/cupcake.png significa "a partir do diretório atual, vá para o subdiretório images e depois para cupcake.png". Os URLs absolutos especificam o caminho completo, incluindo o esquema como https://.

Especificar <link rel=canonical href="example.com/cupcake.html" /> (um URL relativo porque não há https://) implica que o URL canônico desejado é https://example.com/example.com/cupcake.html, mesmo que isso certamente não tenha sido a intenção. Nesses casos, nossos algoritmos podem ignorar o rel=canonical especificado. Isso significa que o que você esperava alcançar com esse rel=canonical não vai se concretizar.

Terceiro erro: declarações não intencionais ou várias declarações de rel=canonical

Às vezes, identificamos designações rel=canonical que acreditamos não serem intencionais. Em circunstâncias muito raras, notamos erros de digitação simples, mas o proprietário de um site ocupado copia um modelo de página sem pensar em alterar o destino de rel=canonical. Agora, as páginas do proprietário do site especificam um rel=canonical para o site do autor do modelo.

Exemplo de marcação rel-canonical incorreta: URL incorreto

Se usar um modelo, verifique se você também copiou a especificação rel=canonical.

Outro problema é quando as páginas incluem vários links rel=canonical para URLs diferentes. Isso acontece com frequência em conjunto com plug-ins de SEO que costumam inserir um link rel=canonical padrão, possivelmente sem conhecimento do webmaster que instalou o plug-in. Em casos de várias declarações de rel=canonical, o Google provavelmente vai ignorar todas as dicas de rel=canonical. Qualquer benefício que um rel=canonical legítimo poderia oferecer será perdido.

Nesses tipos de caso, uma verificação cuidadosa do código-fonte da página ajudará a corrigir o problema. Confira toda a seção <head>, porque os links rel=canonical podem estar dispersos.

Exemplo de marcação rel-canonical incorreta: várias anotações rel-canonical.

Verifique o comportamento dos plug-ins examinando o código-fonte da página.

Quarto erro: a categoria ou a página de destino especifica rel=canonical para um artigo em destaque

Digamos que você tenha um site de sobremesas. Seu site de sobremesas tem páginas de categorias úteis, como "confeitaria" e "sorvete". Todos os dias, as páginas de categoria colocam um artigo exclusivo em destaque. Por exemplo, a página de destino de confeitaria pode apresentar "cupcakes red velvet". Como a página da categoria "confeitaria" tem quase o mesmo conteúdo que a página "cupcake red velvet", adicione um rel=canonical da página de categoria para o artigo em destaque.

Se esse rel=canonical fosse aceito, sua página da categoria "confeitaria" não apareceria nos resultados da pesquisa. Isso acontece porque o rel=canonical indica que você prefere que os mecanismos de pesquisa exibam o URL canônico no lugar da cópia. No entanto, se você quer que os usuários encontrem a página de categoria e o artigo em destaque, é melhor ter apenas um rel=canonical autorreferencial na página ou nada.

Exemplo de marcação rel-canonical incorreta: URL não oficial da página

A designação canônica também indica o URL que o webmaster prefere que seja exibido. Evite adicionar um rel=canonical de uma página de destino ou de categoria para um artigo em destaque.

Quinto erro: rel=canonical no <body>

A tag do link rel=canonical aparece apenas no <head> de um documento HTML. Além disso, para evitar problemas de análise do HTML, é bom incluir o rel=canonical o quanto antes em <head>. Quando encontramos uma designação rel=canonical em <body>, ela é desconsiderada.

Esse é um erro fácil de corrigir. Basta verificar novamente se os links rel=canonical estão sempre no <head> da página e aparecem o mais cedo possível.

Exemplo de marcação rel-canonical incorreta: anotação rel-canonical no elemento HTML &quot;body&quot;.

As designações rel=canonical no <head> são processadas, e não as <body>.

Conclusão

Para criar designações rel=canonical valiosas:

  • Confirme que grande parte do conteúdo principal em uma página duplicada também aparece na página canônica.
  • Confira se rel=canonical é especificado apenas uma vez (se houver) e no <head> da página.
  • Verifique se rel=canonical aponta para um URL existente com bom conteúdo (ou seja, não um 404 ou pior, um soft 404).
  • Evite especificar rel=canonical das páginas de destino ou de categoria para artigos em destaque, pois isso fará com que o artigo seja o URL preferencial nos resultados de pesquisa.

Por fim, esclareça as suas dúvidas em nosso Fórum de Ajuda para webmasters.