Práticas recomendadas para sitemaps em XML e feeds RSS/Atom

quinta-feira, 25 de junho de 2015


O envio de sitemaps pode ser uma parte importante da otimização de websites. Os sitemaps permitem que os mecanismos de pesquisa descubram todas as páginas em um site e façam o download delas rapidamente quando há alterações. Aqui explicamos quais campos são importantes nos sitemaps, quando usar sitemaps em XML e feeds RSS/Atom, e como otimizá-los para o Google.

Sitemaps e feeds

Os sitemaps podem estar nos formatos sitemap XML , RSS ou Atom . A diferença mais importante entre esses formatos é que os sitemaps em XML descrevem todo o conjunto de URLs em um site, enquanto os feeds RSS/Atom descrevem as alterações recentes. Isso tem implicações importantes:
  • Os sitemaps em XML geralmente são grandes. Os feeds RSS/Atom são pequenos, contendo somente as atualizações mais recentes do seu site.
  • O download dos sitemaps em XML é feito com menos frequência que o dos feeds RSS/Atom.
Para um rastreamento ideal, recomendamos usar os sitemaps em XML e os feeds RSS/Atom. Os sitemaps em XML darão informações ao Google sobre todas as páginas no seu site. Os feeds RSS/Atom fornecerão todas as atualizações no seu site, ajudando o Google a manter seu conteúdo em dia no índice. O envio de sitemaps ou feeds não garante a indexação dessas URLs.

Exemplo de um sitemap XML: <?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/mypage</loc>
<lastmod>2011-06-27T19:34:00+01:00</lastmod>
<!-- optional additional tags -->
</url>
<url>
...
</url>
</urlset>

Exemplo de um feed RSS:

<?xml version="1.0" encoding="utf-8"?>
<rss>
<channel>
<!-- other tags -->
<item>
<!-- other tags -->
<link>https://example.com/mypage</link>
<pubDate>Mon, 27 Jun 2011 19:34:00 +0100</pubDate>
</item>
<item>
...
</item>
</channel>
</rss>

Exemplo de um feed Atom:

<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="https://www.w3.org/2005/Atom">
<!-- other tags -->
<entry>
<link href="https://example.com/mypage" />
<updated>2011-06-27T19:34:00+01:00</updated>
<!-- other tags -->
</entry>
<entry>
...
</entry>
</feed>


As “outras tags” se referem às tags opcionais e obrigatórias pelos respectivos padrões. Recomendamos que você especifique as tags obrigatórias para Atom/RSS, pois elas o ajudarão a aparecer em outras propriedades que podem usar esses feeds, além da Pesquisa Google.

Práticas recomendadas

Campos importantes

Os sitemaps em XML e os feeds RSS/Atom, em sua essência, são listas de URLs com metadados anexados. As duas informações mais importantes para o Google são o próprio URL e o horário da última modificação:

URLs

As URLs nos sitemaps em XML e feeds RSS/Atom devem seguir as seguintes diretrizes:
  • Incluir somente URLs que podem ser buscados pelo Googlebot . Um erro comum é incluir URLs não permitidos pelo robots.txt, que não podem ser buscados pelo Googlebot, ou incluir URLs de páginas que não existem.
  • Incluir somente URLs canônicos . Um erro comum é incluir os URLs de páginas duplicadas. Isso aumenta o carregamento no seu servidor sem melhorar a indexação.

Horário da última modificação

Especifique o horário da última modificação para cada URL em um sitemap XML e feed RSS/Atom. O horário da última modificação deve ser a última vez que o conteúdo da página foi alterado de maneira significativa. Se uma alteração tiver sido feita para ficar visível nos resultados da pesquisa, o horário da última modificação deverá ser a hora que essa alteração foi realizada.

  • O sitemap XML usa <lastmod>
  • O RSS usa <pubDate>
  • O Atom usa <updated>

Defina ou atualize o horário da última modificação corretamente:

  • Especifique o horário no formato correto: formato data e hora do W3C para sitemaps XML, RFC3339 para Atom e RFC822 para RSS.
  • Atualize o horário da modificação somente quando o conteúdo for alterado significativamente.
  • Não defina o horário da última modificação para o horário atual todas as vezes que o sitemap ou o feed for veiculado.

Sitemaps XML

Os sitemaps XML devem ter URLs de todas as páginas no seu site. Em geral, eles são grandes e são atualizados com pouca frequência. Siga estas diretrizes:
  • Para um único sitemap XML: atualize-o pelo menos uma vez por dia (caso seu site seja alterado regularmente) e dê um ping no Google depois de atualizá-lo.
  • Para um conjunto de sitemaps XML: maximize o número de URLs em cada sitemap XML. O limite é 50.000 URLs ou um tamanho máximo de 10 MB não compactados, o que for atingido primeiro. Dê um ping no Google para cada sitemap XML atualizado (ou uma vez para o índice de sitemaps, caso seja usado) todas as vezes que ele for atualizado. Um erro comum é colocar somente alguns URLs em cada arquivo de Sitemap XML, o que geralmente dificulta para que o Google faça o download de todos esses sitemaps XML em um tempo razoável.

RSS/Atom

Os feeds RSS/Atom devem transmitir as atualizações recentes do seu site. Em geral, eles são pequenos e são atualizados com frequência. Para esses feeds, recomendamos:
  • Quando uma nova página é adicionada ou uma página existente é alterada significativamente, adicione o URL e o horário da modificação ao feed.
  • Para que o Google não perca atualizações, o feed RSS/Atom deve ter todas as atualizações desde a última vez que o Google fez o download dele. A melhor maneira de conseguir isso é usando o PubSubHubbub . O hub propagará o conteúdo do seu feed para todas as partes interessadas (leitores RSS, mecanismos de pesquisa etc.) da maneira mais rápida e eficiente possível.

Gerar os sitemaps XML e feeds Atom/RSS é uma ótima maneira de otimizar o rastreamento de um site para o Google e outros mecanismos de pesquisa. As principais informações nesses arquivos são o URL canônico e o horário da última modificação das páginas no website. Configurá-los corretamente e notificar o Google e outros mecanismos de pesquisa com pings dos sitemaps e PubSubHubbub permitirá que seu website seja rastreado da melhor forma e representado apropriadamente nos resultados da pesquisa.

Se você tiver alguma pergunta, junte-se a outros webmasters na seção sobre sitemaps do Fórum de Ajuda para webmasters .

Postado por Alkis Evlogimenos, equipe de Feeds do Google