Créer une liste d'URL

Pour que nos systèmes trouvent votre contenu, nous avons besoin de ses URL. Comme indiqué dans notre introduction à l'indexation, l'exploration de votre site Web peut avoir lieu selon le cours naturel déterminé par nos algorithmes, sans nécessiter aucune intervention de votre part. Cette approche peut correspondre à vos besoins.

Toutefois, en cas d'ajout de nouvelles pages ou d'informations obscures difficilement identifiables, vous pouvez créer une liste de vos URL (également appelée "sitemap") afin d'aider nos systèmes à détecter ces dernières. Dans de nombreux cas, ce sitemap sera suffisant pour nous permettre de trouver votre dernier balisage et pour afficher votre contenu sous forme de résultats enrichis dans la recherche Google.

Types d'URL à fournir

Les URL que vous fournissez à Google sont classées selon deux catégories générales :

  • URL canoniques : URL principales de votre contenu.

    Dans la plupart des cas, l'URL canonique est l'URL de prédilection utilisée pour accéder à un contenu spécifique sur un site Web. Par exemple, si le contenu est disponible sous des URL distinctes (telles qu'une version HTML et une version AMP HTML) et que vous préférez la version HTML, vous définissez l'URL de la version HTML en tant qu'URL canonique. À l'inverse, si le site est entièrement créé en AMP HTML sans contenu HTML correspondant, l'URL AMP devrait être l'URL canonique, étant donné qu'il n'existe aucune autre URL. En savoir plus sur les URL canoniques dans notre centre d'aide.

  • Autres URL : URL des autres pages.

    En règle générale, vous spécifiez d'autres URL lorsque vous utilisez plusieurs formats d'URL pour le même contenu, tels que des pages AMP ou du contenu traduit à partir de l'original. Lorsque ces URL sont liées, nos systèmes peuvent plus facilement consolider le classement d'un contenu similaire et proposer la ressource appropriée aux internautes, telle qu'une page AMP pour un mobinaute.

Pour plus d'informations, découvrez comment associer vos ressources en ligne.

Créer un sitemap simple

Le sitemap le plus élémentaire est une liste des URL canoniques sous forme de fichier texte. Vous pouvez générer cette liste et l'héberger sur votre site. Ce fichier contient une URL par ligne. Par exemple :

http://www.example.com/dogs/poodles/poodle1.html
http://www.example.com/dogs/poodles/poodle2.html

Les générateurs de sitemaps simplifient la création de fichiers pour votre site et sont disponibles pour de nombreux systèmes de gestion de contenu, tels que WordPress et Drupal. Ils génèrent habituellement des fichiers XML, dont le format est également compatible avec nos systèmes.

Un sitemap au format texte permet uniquement la découverte du contenu. Il ne permet pas à nos systèmes de déterminer quand le contenu a été mis à jour, car il ne contient pas de métadonnées supplémentaires, telles que la date de modification, ni une liste des URL des autres pages. Pour indiquer les autres pages, ajoutez un lien vers celles-ci à partir de la page canonique et assurez-vous qu'elles renvoient elles-mêmes vers l'URL canonique, comme décrit dans la section Associer vos ressources en ligne.

En savoir plus sur les sitemaps dans le centre d'aide de la Search Console.

Créer un sitemap XML

Si vous souhaitez fournir des mises à jour d'informations sur vos URL et établir des relations entre elles et d'autres URL, il peut être judicieux d'utiliser un sitemap XML. Ce dernier permet de répertorier les URL canoniques et autres dans un même fichier et d'indiquer les dates de modification.

L'exemple suivant illustre un sitemap XML simple avec une entrée de page unique, qui utilise à la fois des URL canoniques et des URL AMP, et qui détermine une date de modification.

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://example.com/dogs/poodles/poodle1.html</loc>
    <xhtml:link rel="amphtml" href="http://example.com/dogs/poodles/poodle1.amp.html"/>
    <lastmod>2016-01-13T18:30:02Z</lastmod>
  </url>
</urlset>

L'horodatage de la date doit être au format W3C Datetime. Ce format vous permet d'omettre la partie "heure", si vous le souhaitez, et d'utiliser AAAA-MM-JJ.

Consignes relatives aux sitemaps

Nous vous recommandons d'utiliser le format texte brut ou XML pour votre sitemap. Notez également qu'un fichier sitemap ne peut pas contenir plus de 50 000 URL et que sa taille ne doit pas dépasser 50 Mo avant compression. Dès lors, si vous disposez d'un grand nombre d'URL, vous devez les répartir dans plusieurs fichiers.

Reportez-vous à la liste complète des consignes relatives aux sitemaps dans l'article Créer et envoyer un sitemap du centre d'aide de la Search Console.

Envoyer des commentaires concernant…