Suppression d'URL (partie I) : URL et répertoires

Mardi 30 mars 2010

De nos jours, Internet renferme quantité de contenus. Une information peut se retrouver exposée sur le Web alors que vous ne souhaitiez pas la présenter sur ce support. Il peut s'agir, par exemple, d'un article ade blog provocateur que vous regrettez d'avoir publié ou de données confidentielles divulguées de manière accidentelle. Dans la plupart des cas, lorsque vous supprimez ce contenu ou en limitez l'accès, il disparaît naturellement des résultats de recherche au bout d'un certain temps. Mais si vous souhaitez supprimer en urgence un contenu indésirable qui a été indexé par Google, sans attendre qu'il disparaisse naturellement, vous pouvez utiliser notre outil de demande de suppression d'URL. Le contenu sera ainsi supprimé rapidement de nos résultats de recherche, à condition qu'il respecte certainscritères (exposés ci-dessous).

Nous avons préparé une série d'articles de blog vous expliquant comment supprimer différents types de contenu. Vous y découvrirez également les erreurs courantes à éviter. Dans ce premier article, je vais vous présenter quelques scénarios classiques, à savoir comment supprimer une URL, un répertoire entier ou l'intégralité d'un site, et comment réintégrer un contenu supprimé. Par ailleurs, je vous conseille vivement de lire notre précédent article aconcernant la gestion de vos informations personnelles publiées sur Internet.

Suppression d'une URL

En général, pour que votre demande de suppression aboutisse, le propriétaire de l'URL en question (que ce soit vous ou une autre personne) doit avoir approuvé la suppression de ce contenu. Il existe trois façons d'approuver la suppression d'une URL :

Avant d'envoyer une demande de suppression, vous pouvez vérifier si l'URL est correctement bloquée :

  • Fichier robots.txt : pour vérifier si l'URL est correctement bloquée, utilisez l'outil Explorer comme Googlebot ou la fonctionnalité de test du fichier robots.txt dans les outils pour les webmasters.
  • Balise meta noindex :vous pouvez utiliser l'outil Explorer comme Googlebot pour vous assurer que la balise meta apparaît entre les balises <head> et </head>. Si vous souhaitez vérifier une page que vous ne parvenez pas à valider dans les outils pour les webmasters, vous pouvez ouvrir l'URL dans un navigateur, puis accéder à Afficher > Source de la page et vous assurer que la balise meta se trouve entre les balises <head> et </head>.
  • Codes d'état 404 et 410 : vous pouvez utiliser l'outil Explorer comme Googlebot ou des outils comme les en-têtes HTTP actifs ou web-sniffer.net pour vérifier si l'URL renvoie le bon code. Le message "404" ou "Introuvable" s'affiche parfois sur les pages "supprimées" alors qu'un code d'état 200est renvoyé dans l'en-tête de la page. Par conséquent, vérifiez cet en-tête plutôt deux fois qu'une à l'aide d'un outil approprié.

Si le contenu indésirable a été supprimé de la page, mais que cette dernière n'a été bloquée par aucun des moyens mentionnés ci-dessus, vous ne pourrez passupprimer complètement l'URL de nos résultats de recherche. Cette situation se présente généralement lorsque vous n'êtes pas le propriétaire du site hébergeant le contenu. Nous aborderons la procédure à suivre dans une telle situation, dans un prochain article de la série Partie II : Suppressions de contenu.

Si une URL répond à l'un des critères ci-dessus, vous pouvez la supprimer. Pour ce faire, accédez à l'outil de suppression, saisissez l'URL que vous souhaitez supprimer, puis sélectionnez l'option "Le webmaster a déjà bloqué la page". L'URL à indiquer correspond à la page sur laquelle le contenu est hébergé, et non à l'URL de la page des résultats de recherche Google sur laquelle elle s'affiche. Par exemple, saisissez https://www.example.com/embarrassing-stuff.html, pas https://www.google.com/search?q=embarrassing+stuff.

Pour vous assurer de saisir l'URL appropriée, consultez cet article du centre d'aide. N'oubliez pas que si vous ne nous communiquez pas l'URL exacte qui vous pose problème, nous ne serons pas en mesure de supprimer le contenu visé.

Suppression de l'intégralité d'un répertoire ou d'un site

Pour qu'une demande de suppression d'un répertoire ou d'un site entier aboutisse, le répertoire ou le site en question doit être bloqué dans le fichier robots.txt du site. Par exemple, pour supprimer le répertoire https://www.example.com/secret/, le fichier robots.txt doit inclure :

User-agent: *
Disallow: /secret/

Le fait que la racine du répertoire renvoie un code d'état 404 ne signifie pas pour autant que les fichiers présents dans ce répertoire ne s'afficheront pas. En bloquant un répertoire (ou un site entier) à l'aide du fichier robots.txt, vous êtes certain que toutes les URL associées à ce répertoire (ou à ce site) seront également bloquées. Pour vérifier si un répertoire a été correctement bloqué, vous pouvez utiliser l'outilExplorer comme Googlebot ou la fonctionnalité de test du fichier robots.txt dans les outils pour les webmasters.

Seuls les propriétaires validés d'un site peuvent demander la suppression de l'intégralité de ce site ou de l'un de ses répertoires dans les outils pour les webmasters. Pour demander la suppression d'un répertoire ou d'un site, cliquez sur le site en question, puis sélectionnez Configuration du site > Accès du robot d'exploration > Supprimer l'URL. Si l'URL à supprimer correspond à la racine de votre site, vous êtes invité à confirmer la suppression de l'intégralité du site. Si vous saisissez un sous-répertoire, sélectionnez l'option "Supprimer un répertoire" dans le menu déroulant.

Réintégration de contenu

Vous pouvez, à tout moment, annuler les demandes de suppression liées aux sites dont vous êtes le propriétaire, y compris celles émanant de tiers. Pour ce faire, vous devez être un propriétaire validé de ce site dans les outils pour les webmasters. Une fois ce statut confirmé, vous pouvez accéder à la page Configuration du site > Accès du robot d'exploration > Supprimer l'URL > URL supprimées (ou > Demandées par d'autres webmasters), puis cliquer sur "Annuler" à côté des demandes à annuler.

Vous avez d'autres questions ? D'autres articles de cette série traitant de la suppression de contenu dans les résultats de recherche Google seront bientôt publiés. Vous ne souhaitez pas attendre ? Dans ce cas, n'hésitez pas à consulter notre Forum d'aide. Celui-ci contient déjà de nombreuses informations sur la suppression des URL et sur la marche à suivre en cas de problème. Si vous avez encore des questions après avoir lu les expériences des autres, n'hésitez pas à nous en faire part. Sachez cependant que, bien souvent, il est difficile de donner des conseils pertinents à propos de la suppression d'un contenu spécifique sans connaître le site ou l'URL en question. Nous vous recommandons de partager votre URL en faisant appel à un service de raccourcissement d'URL. De cette manière, l'URL qui pose problème et qui s'affiche dans votre message ne sera pas indexée. Certains de ces services permettent même de désactiver le raccourci par la suite, une fois le problème résolu.

Peut-être souhaitez-vous aussi savoir comment gérer les informations disponibles en ligne et qui vous concernent.