Lundi 12 mars 2012
La page "Erreurs d'exploration" fait partie des fonctionnalités les plus appréciées des outils pour les webmasters. Aujourd'hui, nous mettons en œuvre quelques améliorations importantes qui la rendront encore plus utile.
Désormais, nous détectons et signalons une multitude de nouveaux types d'erreurs. Afin de vous aider à interpréter correctement ces nouvelles données, nous avons créé deux catégories : les erreurs au niveau du site et les erreurs liées aux URL.
Erreurs au niveau du site
Les erreurs liées au site ne concernent pas une URL précise, mais la totalité de votre site. Il peut s'agir de problèmes de résolution du DNS, de connectivité avec votre serveur Web ou de récupération de votre fichier robots.txt. Auparavant, nous signalions ces erreurs URL par URL. Toutefois, ce classement n'était pas très logique dans la mesure où ces problèmes ne concernaient pas des URL précises. En réalité, ces erreurs empêchent même Googlebot de demander une URL ! Dorénavant, nous étudions de près les taux d'échec pour chaque type d'erreur se produisant à l'échelle du site. Nous essaierons également de vous envoyer des alertes si ces erreurs deviennent trop fréquentes et requièrent donc une attention particulière.
En outre, si, comme beaucoup de webmasters, vous ne rencontrez actuellement aucun problème dans ces domaines et si vous n'en avez pas rencontré récemment, cette section ne vous est pas proposée. À la place, nous vous présentons seulement les points vérifiés pour vous informer qu'il n'y a aucune erreur à signaler.
Erreurs liées aux URL
Les erreurs liées aux URL sont spécifiques à une page spécifique. Autrement dit, lorsque Googlebot a exploré l'URL en question, votre DNS a bien été résolu, la connexion avec votre serveur a été établie et votre fichier robots.txt a été récupéré et lu, puis la demande d'URL a été effectuée, mais une erreur s'est ensuite produite. Nous classons les erreurs liées aux URL dans plusieurs catégories en fonction de leur cause. Si votre site comporte des données Google Actualités ou destinées aux mobiles (CHTML/XHTML), nous affichons des catégories distinctes pour ces erreurs.
S'en tenir à l'essentiel
Auparavant, nous vous présentions jusqu'à 100 000 erreurs par type. Il vous était impossible de traiter toutes ces informations, et vous n'aviez aucun moyen de distinguer les erreurs graves (la page d'accueil de votre site n'est plus disponible) des erreurs moins problématiques (un lien renvoyant vers votre site comporte une coquille sur le site personnel de quelqu'un). Aucune solution réaliste n'était envisageable pour afficher l'ensemble des 100 000 erreurs. Vous ne pouviez pas effectuer de recherches, ni trier les erreurs, ni suivre votre avancement. Dans cette nouvelle version, nous avons fait en sorte que les erreurs les plus importantes apparaissent en priorité. Pour chaque catégorie, nous vous présentons les 1 000 erreurs les plus importantes selon nous et qui nécessitent une action de votre part. Vous pouvez trier et filtrer ces erreurs, afficher des informations détaillées les concernant et nous prévenir lorsque vous pensez les avoir corrigées.
Certains sites présentent plus de 1 000 erreurs pour chaque catégorie. Par conséquent, nous vous avons laissé la possibilité de connaître le nombre total d'erreurs pour chaque type et d'accéder à un graphique affichant des données historiques remontant à 90 jours. Certains d'entre vous pensent peut-être que 1 000 erreurs détaillées et un nombre total d'erreurs ne seront pas suffisants. Sachez que nous envisageons d'ajouter une interface de programmation (API) pour vous permettre de télécharger toutes les erreurs rencontrées. Si vous avez besoin d'autres fonctionnalités, n'hésitez pas à nous l'indiquer.
Nous avons également supprimé la liste des pages bloquées par le fichier robots.txt. En effet, bien qu'elles puissent être utiles lors du diagnostic d'un problème spécifique à votre fichier robots.txt, il s'agit bien souvent de pages que vous avez bloquées volontairement. Nous voulions vraiment nous concentrer sur les erreurs. Par conséquent, la fonctionnalité "Accès du robot d'exploration" sous "Configuration du site" devrait bientôt proposer des informations à propos des URL explorées.
Détails des erreurs
Lorsque vous cliquez sur une erreur liée à une URL dans la liste principale, un volet contenant des informations supplémentaires s'affiche. Il indique notamment à quand remonte la dernière exploration de l'URL, le jour où nous avons détecté le problème pour la première fois, ainsi qu'une brève explication de l'erreur.
Dans ce volet, vous pouvez cliquer sur le lien de l'URL à l'origine de l'erreur afin de voir par vous-même ce qu'il se passe lorsque vous tentez de consulter la page correspondante. Vous pouvez également marquer l'erreur comme "corrigée" (nous reviendrons plus en détail sur cette approche ultérieurement), afficher le contenu d'aide correspondant au type d'erreur, consulter les sitemaps qui contiennent l'URL, identifier les autres pages qui renvoient vers cette URL, voire demander à Googlebot d'extraire immédiatement l'URL pour obtenir plus d'informations ou pour vérifier que vos corrections ont porté leurs fruits.
À vous de jouer !
S'il existe un aspect dont nous sommes particulièrement fiers dans cette nouvelle version de la page "Erreurs d'exploration", c'est qu'elle permet de se concentrer sur la correction des principaux problèmes. Nous avons classé les erreurs de sorte que celles qui se trouvent en haut de la liste de priorités peuvent être corrigées. Il peut s'agir de réparer un lien non fonctionnel sur votre propre site, d'éliminer un bug dans votre logiciel serveur, de mettre à jour vos sitemaps pour supprimer les URL inactives ou d'ajouter une redirection 301
afin d'orienter les utilisateurs vers la page "réelle". Nous établissons cette liste de priorités à partir de plusieurs facteurs. Nous regardons si l'URL est incluse dans un sitemap ou non, et si elle a récemment reçu du trafic depuis la recherche, et nous prenons en compte le nombre de pages contenant des liens redirigeant vers cette URL (et nous regardons si ces pages appartiennent à votre site).
Une fois que vous pensez avoir résolu le problème (vous pouvez tester vos corrections en explorant l'URL en tant que Googlebot), il vous suffit de marquer l'erreur comme "corrigée" pour nous le signaler. Notez que vous devez disposer des autorisations d'accès complet en tant qu'utilisateur. L'erreur sera ainsi supprimée de la liste. À l'avenir, les erreurs que vous aurez marquées comme étant corrigées ne seront plus incluses dans la liste des principales erreurs, sauf si nous rencontrons la même erreur lors d'une nouvelle exploration d'URL.
Nous nous sommes beaucoup investis dans cette nouvelle version de la page "Erreurs d'exploration", aussi nous espérons qu'elle vous sera très utile. N'hésitez pas à nous donner votre avis et à nous faire part de vos suggestions en vous rendant sur le forum !