quinta-feira, 25 de junho de 2015
O envio de sitemaps pode ser uma parte importante da otimização de websites. Os sitemaps permitem que os mecanismos de pesquisa descubram todas as páginas em um site e façam o download delas rapidamente quando há alterações. Aqui explicamos quais campos são importantes nos sitemaps, quando usar sitemaps em XML e feeds RSS/Atom, e como otimizá-los para o Google.
Sitemaps e feeds
Os sitemaps podem estar nos formatos sitemap XML , RSS ou Atom . A diferença mais importante entre esses formatos é que os sitemaps em XML descrevem todo o conjunto de URLs em um site, enquanto os feeds RSS/Atom descrevem as alterações recentes. Isso tem implicações importantes:
- Os sitemaps em XML geralmente são grandes. Os feeds RSS/Atom são pequenos, contendo somente as atualizações mais recentes do seu site.
- O download dos sitemaps em XML é feito com menos frequência que o dos feeds RSS/Atom.
Exemplo de um sitemap XML:
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="https://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/mypage</loc>
<lastmod>2011-06-27T19:34:00+01:00</lastmod>
<!-- optional additional tags -->
</url>
<url>
...
</url>
</urlset>
Exemplo de um feed RSS:
<?xml version="1.0" encoding="utf-8"?>
<rss>
<channel>
<!-- other tags -->
<item>
<!-- other tags -->
<link>https://example.com/mypage</link>
<pubDate>Mon, 27 Jun 2011 19:34:00 +0100</pubDate>
</item>
<item>
...
</item>
</channel>
</rss>
Exemplo de um feed Atom:
<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="https://www.w3.org/2005/Atom">
<!-- other tags -->
<entry>
<link href="https://example.com/mypage" />
<updated>2011-06-27T19:34:00+01:00</updated>
<!-- other tags -->
</entry>
<entry>
...
</entry>
</feed>
As “outras tags” se referem às tags opcionais e obrigatórias pelos respectivos padrões. Recomendamos que você especifique as tags obrigatórias para Atom/RSS, pois elas o ajudarão a aparecer em outras propriedades que podem usar esses feeds, além da Pesquisa Google.
Práticas recomendadas
Campos importantes
Os sitemaps em XML e os feeds RSS/Atom, em sua essência, são listas de URLs com metadados anexados. As duas informações mais importantes para o Google são o próprio URL e o horário da última modificação:
URLs
As URLs nos sitemaps em XML e feeds RSS/Atom devem seguir as seguintes diretrizes:
- Incluir somente URLs que podem ser buscados pelo Googlebot . Um erro comum é incluir URLs não permitidos pelo robots.txt, que não podem ser buscados pelo Googlebot, ou incluir URLs de páginas que não existem.
- Incluir somente URLs canônicos . Um erro comum é incluir os URLs de páginas duplicadas. Isso aumenta o carregamento no seu servidor sem melhorar a indexação.
Horário da última modificação
Especifique o horário da última modificação para cada URL em um sitemap XML e feed RSS/Atom. O horário da última modificação deve ser a última vez que o conteúdo da página foi alterado de maneira significativa. Se uma alteração tiver sido feita para ficar visível nos resultados da pesquisa, o horário da última modificação deverá ser a hora que essa alteração foi realizada.
-
O sitemap XML usa
<lastmod>
-
O RSS usa
<pubDate>
-
O Atom usa
<updated>
Defina ou atualize o horário da última modificação corretamente:
- Especifique o horário no formato correto: formato data e hora do W3C para sitemaps XML, RFC3339 para Atom e RFC822 para RSS.
- Atualize o horário da modificação somente quando o conteúdo for alterado significativamente.
- Não defina o horário da última modificação para o horário atual todas as vezes que o sitemap ou o feed for veiculado.
Sitemaps XML
Os sitemaps XML devem ter URLs de todas as páginas no seu site. Em geral, eles são grandes e são atualizados com pouca frequência. Siga estas diretrizes:
- Para um único sitemap XML: atualize-o pelo menos uma vez por dia (caso seu site seja alterado regularmente) e dê um ping no Google depois de atualizá-lo.
- Para um conjunto de sitemaps XML: maximize o número de URLs em cada sitemap XML. O limite é 50.000 URLs ou um tamanho máximo de 10 MB não compactados, o que for atingido primeiro. Dê um ping no Google para cada sitemap XML atualizado (ou uma vez para o índice de sitemaps, caso seja usado) todas as vezes que ele for atualizado. Um erro comum é colocar somente alguns URLs em cada arquivo de Sitemap XML, o que geralmente dificulta para que o Google faça o download de todos esses sitemaps XML em um tempo razoável.
RSS/Atom
Os feeds RSS/Atom devem transmitir as atualizações recentes do seu site. Em geral, eles são pequenos e são atualizados com frequência. Para esses feeds, recomendamos:
- Quando uma nova página é adicionada ou uma página existente é alterada significativamente, adicione o URL e o horário da modificação ao feed.
- Para que o Google não perca atualizações, o feed RSS/Atom deve ter todas as atualizações desde a última vez que o Google fez o download dele. A melhor maneira de conseguir isso é usando o PubSubHubbub . O hub propagará o conteúdo do seu feed para todas as partes interessadas (leitores RSS, mecanismos de pesquisa etc.) da maneira mais rápida e eficiente possível.
Gerar os sitemaps XML e feeds Atom/RSS é uma ótima maneira de otimizar o rastreamento de um site para o Google e outros mecanismos de pesquisa. As principais informações nesses arquivos são o URL canônico e o horário da última modificação das páginas no website. Configurá-los corretamente e notificar o Google e outros mecanismos de pesquisa com pings dos sitemaps e PubSubHubbub permitirá que seu website seja rastreado da melhor forma e representado apropriadamente nos resultados da pesquisa.
Se você tiver alguma pergunta, junte-se a outros webmasters na seção sobre sitemaps do Fórum de Ajuda para webmasters .
Postado por Alkis Evlogimenos, equipe de Feeds do Google