En quoi consiste le choix de l'URL canonique ?

Le choix de l'URL canonique consiste à sélectionner l'URL représentative (canonique) d'un contenu. Par conséquent, une URL canonique est l'URL d'une page que Google a choisie comme page la plus représentative d'un ensemble de pages en double. Ce processus, souvent appelé déduplication, permet à Google d'afficher une seule version du contenu en double dans ses résultats de recherche.

Un site peut présenter du contenu en double pour de nombreuses raisons :

  • Variantes régionales : cela peut être le cas d'un contenu destiné aux États-Unis et au Royaume-Uni, accessible à partir d'URL différentes, mais avec en grande partie le même contenu dans la même langue.
  • Variantes d'appareils : cela peut être le cas d'une page avec une version pour mobile et une version pour ordinateur.
  • Variantes de protocole : cela peut être le cas pour les versions HTTP et HTTPS d'un site.
  • Fonctions de site : cela peut être le cas avec les résultats des fonctions de tri et de filtrage d'une page de catégories.
  • Variantes accidentelles : cela peut être le cas lorsque la version de démonstration d'un site reste accidentellement accessible aux robots d'exploration.

Le contenu en double sur un site est normal et n'enfreint pas les Règles Google concernant le spam. Toutefois, la présence d'un même contenu via de nombreuses URL différentes peut nuire à l'expérience utilisateur. Par exemple, les internautes peuvent se demander quelle est la bonne page et s'il existe une différence entre les deux. Cela peut compliquer le suivi des performances de votre contenu dans les résultats de recherche.

Comment Google indexe et sélectionne l'URL canonique

Lorsque Google indexe une page, il détermine le contenu principal (ou la pièce maîtresse) de chaque page. Si Google trouve plusieurs pages qui semblent être identiques ou dont le contenu principal se ressemble fortement, il choisit la page qui, en fonction des facteurs (ou signaux) collectés par le processus d'indexation, est objectivement la plus complète et la plus utile pour les utilisateurs de la recherche Google, et la définit comme canonique. La page canonique est explorée plus régulièrement. Les pages en double sont analysées moins souvent afin de réduire la charge d'exploration sur les sites.

Plusieurs facteurs jouent un rôle dans le choix de l'URL canonique : protocole utilisé pour diffuser la page (HTTP ou HTTPS), redirections, présence de l'URL dans un sitemap et annotations link rel="canonical". Vous pouvez utiliser ces techniques pour indiquer votre préférence à Google, mais Google peut choisir une autre page canonique pour diverses raisons. Autrement dit, l'indication d'une préférence canonique ne garantit pas que l'URL sera choisie comme URL canonique.

Les différentes versions linguistiques d'une même page ne sont considérées comme des doublons que si le contenu principal est dans la même langue. En d'autres termes, si seuls l'en-tête, le pied de page et tout autre texte secondaire sont traduits, mais que le corps du texte reste le même, ces pages sont considérées comme des doublons. Pour en savoir plus sur la configuration des sites localisés, consultez la documentation sur la gestion des sites multilingues et multirégionaux.

Google utilise la page canonique comme source principale pour évaluer le contenu et la qualité. Le résultat de recherche Google redirige généralement vers la page canonique, sauf si l'un des doublons est plus précisément adapté à l'utilisateur. Par exemple, le résultat de recherche redirigera probablement vers la page mobile si l'internaute utilise un appareil mobile, même si la page canonique est la page pour ordinateur.

Découvrez comment indiquer une URL canonique préférée et si cela est vraiment utile dans votre cas de figure.