Cinco erros comuns no uso de rel=canonical

Segunda-feira, 8 de abril de 2013

Esta postagem foi publicada no blog há algum tempo. Talvez algumas informações estejam desatualizadas. Por exemplo, pode ser que certas imagens estejam faltando e parte dos links não funcione mais. rel="prev" e rel="next" não são mais compatíveis.

Incluir um rel=canonical link na sua página da Web é uma boa dica para os mecanismos de pesquisa usarem a versão de sua preferência para indexar páginas duplicadas na Web. Ele é aceito por vários mecanismos de pesquisa, incluindo Yahoo!, Bing e Google. O link rel=canonical consolida as propriedades de indexação das páginas duplicadas, como os links de entrada, e especifica qual URL você quer exibir nos resultados da pesquisa. No entanto, rel=canonical pode ser um pouco complicado porque não é muito óbvio quando há uma configuração incorreta.

Exemplo de uma página e sua marcação HTML para rel-canonical.

Embora o webmaster veja a página "red velvet" à esquerda no navegador, os mecanismos de pesquisa processam o rel=canonical não intencional de "blue velvet" do webmaster à direita. Recomendamos as seguintes práticas recomendadas para usar rel=canonical:

Grande parte do conteúdo das páginas duplicadas deve estar presente na versão canônica.
Faça o seguinte teste: imagine que você não entende o idioma do conteúdo. Se você colocar a versão duplicada ao lado da versão canônica, uma porcentagem considerável das palavras da página duplicada aparece na página canônica? Se for preciso falar o idioma para entender que essas páginas são semelhantes (por exemplo, se elas forem parecidas apenas nos tópicos, mas não tiverem exatamente as mesmas palavras), a designação canônica poderá ser desconsiderada pelos mecanismos de pesquisa.
Verifique se o destino rel=canonical existe e que não seja um erro ou "soft 404".
Verifique se o destino do rel=canonical não contém uma meta tag robots noindex.
Prefira que o URL rel=canonical seja exibido nos resultados da pesquisa em vez do URL duplicado.
Inclua o link rel=canonical no <head> da página ou no cabeçalho HTTP.
Especifique no máximo um rel=canonical por página. Quando mais de um é especificado, todos os links rel=canonical são ignorados.

Primeiro erro: `rel=canonical` na primeira página de uma série paginada

Imagine que você tem um artigo que se estende por várias páginas:

example.com/article?story=cupcake-news&page=1
example.com/article?story=cupcake-news&page=2
e assim por diante.

Especificar um rel=canonical da página 2 (ou de qualquer página posterior) para a página 1 não faz uso correto de rel=canonical, já que essas páginas não são duplicadas. O uso de rel=canonical nesse caso resultaria na não indexação do conteúdo da página 2 e das páginas posteriores.

Exemplo de marcações rel-canonical incorretas. — Conteúdo de qualidade, como “biscoitos têm mais nutrientes que” e “os vegetais”, é perdido ao especificar `rel=canonical` no componente à primeira página de uma série.

Exemplo de anotação de uma série de páginas com rel-canonical que leva a uma única página com todo o conteúdo da série. — `rel=canonical` de páginas de componentes para a página de exibição total

Exemplo de anotação de páginas com rel-canonical e as anotações rel-prev-next descontinuadas. — Se `rel=canonical` a uma página de exibição total não estiver designado, um conteúdo paginado poderá usar a marcação `rel="prev"` e `rel="next"`.

Segundo erro: URLs absolutos escritos incorretamente como URLs relativos

Exemplo de marcação rel-canonical incorreta: URLs relativos errados

A tag <link>, como muitas tags HTML, aceita URLs relativos e absolutos. Os URLs relativos incluem um caminho "relative" para a página atual. Por exemplo, images/cupcake.png significa "a partir do diretório atual, vá para o subdiretório images e depois para cupcake.png". Os URLs absolutos especificam o caminho completo, incluindo o esquema como https://.

Especificar <link rel=canonical href="example.com/cupcake.html" /> (um URL relativo porque não há https://) implica que o URL canônico desejado é https://example.com/example.com/cupcake.html, mesmo que isso certamente não tenha sido a intenção. Nesses casos, nossos algoritmos podem ignorar o rel=canonical especificado. Isso significa que o que você esperava alcançar com esse rel=canonical não vai se concretizar.

Terceiro erro: declarações não intencionais ou várias declarações de `rel=canonical`

Às vezes, identificamos designações rel=canonical que acreditamos não serem intencionais. Em circunstâncias muito raras, notamos erros de digitação simples, mas o proprietário de um site ocupado copia um modelo de página sem pensar em alterar o destino de rel=canonical. Agora, as páginas do proprietário do site especificam um rel=canonical para o site do autor do modelo.

Exemplo de marcação rel-canonical incorreta: URL incorreto

Se usar um modelo, verifique se você também copiou a especificação rel=canonical.

Outro problema é quando as páginas incluem vários links rel=canonical para URLs diferentes. Isso acontece com frequência em conjunto com plug-ins de SEO que costumam inserir um link rel=canonical padrão, possivelmente sem conhecimento do webmaster que instalou o plug-in. Em casos de várias declarações de rel=canonical, o Google provavelmente vai ignorar todas as dicas de rel=canonical. Qualquer benefício que um rel=canonical legítimo poderia oferecer será perdido.

Nesses tipos de caso, uma verificação cuidadosa do código-fonte da página ajudará a corrigir o problema. Confira toda a seção <head>, porque os links rel=canonical podem estar dispersos.

Exemplo de marcação rel-canonical incorreta: várias anotações rel-canonical.

Verifique o comportamento dos plug-ins examinando o código-fonte da página.

Quarto erro: a categoria ou a página de destino especifica `rel=canonical` para um artigo em destaque

Digamos que você tenha um site de sobremesas. Seu site de sobremesas tem páginas de categorias úteis, como "confeitaria" e "sorvete". Todos os dias, as páginas de categoria colocam um artigo exclusivo em destaque. Por exemplo, a página de destino de confeitaria pode apresentar "cupcakes red velvet". Como a página da categoria "confeitaria" tem quase o mesmo conteúdo que a página "cupcake red velvet", adicione um rel=canonical da página de categoria para o artigo em destaque.

Se esse rel=canonical fosse aceito, sua página da categoria "confeitaria" não apareceria nos resultados da pesquisa. Isso acontece porque o rel=canonical indica que você prefere que os mecanismos de pesquisa exibam o URL canônico no lugar da cópia. No entanto, se você quer que os usuários encontrem a página de categoria e o artigo em destaque, é melhor ter apenas um rel=canonical autorreferencial na página ou nada.

Exemplo de marcação rel-canonical incorreta: URL não oficial da página

A designação canônica também indica o URL que o webmaster prefere que seja exibido. Evite adicionar um rel=canonical de uma página de destino ou de categoria para um artigo em destaque.

Quinto erro: `rel=canonical` no `<body>`

A tag do link rel=canonical aparece apenas no <head> de um documento HTML. Além disso, para evitar problemas de análise do HTML, é bom incluir o rel=canonical o quanto antes em <head>. Quando encontramos uma designação rel=canonical em <body>, ela é desconsiderada.

Esse é um erro fácil de corrigir. Basta verificar novamente se os links rel=canonical estão sempre no <head> da página e aparecem o mais cedo possível.

Exemplo de marcação rel-canonical incorreta: anotação rel-canonical no elemento HTML "body".

As designações rel=canonical no <head> são processadas, e não as <body>.

Conclusão

Para criar designações rel=canonical valiosas:

Confirme que grande parte do conteúdo principal em uma página duplicada também aparece na página canônica.
Confira se rel=canonical é especificado apenas uma vez (se houver) e no <head> da página.
Verifique se rel=canonical aponta para um URL existente com bom conteúdo (ou seja, não um 404 ou pior, um soft 404).
Evite especificar rel=canonical das páginas de destino ou de categoria para artigos em destaque, pois isso fará com que o artigo seja o URL preferencial nos resultados de pesquisa.

Por fim, esclareça as suas dúvidas em nosso Fórum de Ajuda para webmasters.

Escrito por Allan Scott, Engenheiro de software, Equipe de Indexação

Cinco erros comuns no uso de rel=canonical Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Primeiro erro: rel=canonical na primeira página de uma série paginada

Segundo erro: URLs absolutos escritos incorretamente como URLs relativos

Terceiro erro: declarações não intencionais ou várias declarações de rel=canonical

Quarto erro: a categoria ou a página de destino especifica rel=canonical para um artigo em destaque

Quinto erro: rel=canonical no <body>

Conclusão

Cinco erros comuns no uso de rel=canonical

Primeiro erro: `rel=canonical` na primeira página de uma série paginada

Terceiro erro: declarações não intencionais ou várias declarações de `rel=canonical`

Quarto erro: a categoria ou a página de destino especifica `rel=canonical` para um artigo em destaque

Quinto erro: `rel=canonical` no `<body>`