L'indexation de la page est bloquée

Les moteurs de recherche ne peuvent afficher des pages dans leurs résultats de recherche que si elles ne bloquent pas explicitement l'indexation par les robots d'exploration des moteurs de recherche. Certains en-têtes HTTP et certaines balises Meta indiquent aux robots d'exploration qu'une page ne doit pas être indexée.

Bloquez l'indexation uniquement pour le contenu que vous ne souhaitez pas voir figurer dans les résultats de recherche.

Échec de l'audit d'indexation Lighthouse

Lighthouse signale les pages que les moteurs de recherche ne peuvent pas indexer:

Audit Lighthouse indiquant que les moteurs de recherche ne peuvent pas indexer votre page

Lighthouse vérifie uniquement les en-têtes ou les éléments qui bloquent tous les robots d'exploration de moteurs de recherche. Par exemple, l'élément <meta> ci-dessous empêche tous les robots d'exploration de moteurs de recherche (également appelés robots) d'accéder à votre page:

<meta name="robots" content="noindex"/>

Cet en-tête de réponse HTTP bloque également tous les robots d'exploration:

X-Robots-Tag: noindex

Vous pouvez également avoir des éléments <meta> qui bloquent des robots d'exploration spécifiques, tels que:

<meta name="Googlebot" content="noindex"/>

Lighthouse n'échoue pas lors de l'audit concernant les directives spécifiques aux robots d'exploration comme celle-ci, mais elles peuvent rendre votre page plus difficile à découvrir. Par conséquent, utilisez-les avec précaution. Lighthouse émet un avertissement si une directive spécifique au robot d'exploration bloque un robot d'indexation courant.

Comment s'assurer que les moteurs de recherche peuvent explorer votre page

Assurez-vous tout d'abord que vous souhaitez que les moteurs de recherche indexent la page. Certaines pages, comme les sitemaps ou les contenus légaux, ne doivent généralement pas être indexées. Gardez à l'esprit que le blocage de l'indexation n'empêche pas les utilisateurs d'accéder à une page s'ils connaissent son URL.

Pour les pages que vous souhaitez indexer, supprimez les en-têtes HTTP ou les éléments <meta> qui bloquent les robots d'exploration des moteurs de recherche. Selon la façon dont vous configurez votre site, vous devrez peut-être suivre une partie ou la totalité des étapes ci-dessous:

  • Supprimez l'en-tête de réponse HTTP X-Robots-Tag si vous avez configuré un en-tête de réponse HTTP:
X-Robots-Tag: noindex
  • Supprimez la balise Meta suivante si elle est présente dans l'en-tête de la page:
<meta name="robots" content="noindex">
  • Évitez les balises Meta qui bloquent des robots d'exploration spécifiques si elles sont présentes dans l'en-tête de la page. Exemple :
<meta name="Googlebot" content="noindex">

Ajouter une commande supplémentaire (facultatif)

Vous souhaitez peut-être contrôler davantage la façon dont les moteurs de recherche indexent votre page. Par exemple, vous ne souhaitez peut-être pas que Google indexe les images, mais vous voulez que le reste de la page soit indexé.

Afin d'en savoir plus sur la configuration des éléments <meta> et des en-têtes HTTP pour des moteurs de recherche spécifiques, consultez les guides suivants:

Ressources