Validation de Googlebot et des autres robots d'exploration Google
Vous pouvez vérifier que le robot d'exploration qui accède à votre serveur est réellement un robot Google, comme Googlebot. Cela est utile si vous suspectez que des spammeurs ou d'autres personnes mal intentionnées accèdent à votre site en se faisant passer pour Googlebot.
Deux méthodes permettent de valider les robots d'exploration Google :
- Méthode manuelle : pour les recherches ponctuelles, utilisez les outils de ligne de commande. Cette méthode est suffisante dans la plupart des cas.
- Méthode automatique : pour les recherches plus générales, utilisez une solution automatique permettant d'établir une correspondance entre l'adresse IP d'un robot d'exploration et la liste des adresses IP Googlebot publiées.
Utiliser les outils de ligne de commande
-
À l'aide de la commande
host
, exécutez une résolution DNS inverse sur l'adresse IP utilisée dans vos journaux. -
Vérifiez que le nom de domaine est
googlebot.com
ougoogle.com
. -
Effectuez une résolution DNS directe sur le nom de domaine récupéré à l'étape 1 à l'aide de la commande
host
. - Vérifiez qu'il s'agit de la même adresse IP que celle utilisée dans vos journaux.
Exemple 1 :
host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.host crawl-66-249-66-1.googlebot.com
crawl-66-249-66-1.googlebot.com has address 66.249.66.1
Exemple 2 :
host 35.247.243.240
240.243.247.35.in-addr.arpa domain name pointer geo-crawl-35-247-243-240.geo.googlebot.com.host geo-crawl-35-247-243-240.geo.googlebot.com
geo-crawl-35-247-243-240.geo.googlebot.com has address 35.247.243.240
Exemple 3 :
host 66.249.90.77
77.90.249.66.in-addr.arpa domain name pointer rate-limited-proxy-66-249-90-77.google.com.host rate-limited-proxy-66-249-90-77.google.com
rate-limited-proxy-66-249-90-77.google.com has address 66.249.90.77
Utiliser des solutions automatiques
Vous pouvez également identifier Googlebot avec l'adresse IP, en établissant une correspondance entre l'adresse IP du robot d'exploration et la liste des adresses IP Googlebot. Pour les autres adresses IP Google à partir desquelles vous pouvez accéder à votre site (par exemple, sur demande de l'utilisateur ou via Apps Script), faites correspondre l'adresse IP à la Liste des adresses IP Google. Notez que les adresses IP dans les fichiers JSON sont représentées au format CIDR.