Lista de rastreadores para casos especiales de Google
Los rastreadores para casos especiales los utilizan productos específicos de Google en los que existe un acuerdo entre el sitio rastreado y el producto en relación con el proceso de rastreo. Por ejemplo, AdsBot
ignora el user-agent del archivo robots.txt global (*
) con el permiso del editor del anuncio. Las propiedades técnicas generales de los rastreadores de Google también se aplican a los rastreadores para casos especiales.
Es posible que los rastreadores para casos especiales ignoren las reglas de robots.txt, por lo que operan desde un intervalo de IPs distinto al de los rastreadores habituales. Los intervalos de IPs se publican en el objeto special-crawlers.json. La máscara de DNS inversa de los rastreadores para casos especiales coincide con rate-limited-proxy-***-***-***-***.google.com
.
En la siguiente lista se muestran los rastreadores para casos especiales, sus cadenas de user-agent tal como aparecen en las solicitudes HTTP, sus tokens de user-agent de la línea User-agent:
en robots.txt y los productos que se ven afectados por las preferencias de rastreo del rastreador. La lista no es exhaustiva, solo cubre los solicitantes que tienen más probabilidades de aparecer en los archivos de registro y sobre los que hemos recibido preguntas.
APIs-Google
-
User-agent en solicitudes HTTP APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)
robots.txt Token de user-agent en robots.txt APIs-Google
Se ignora el user-agent global (
*
).Ejemplo de grupo de robots.txt user-agent: APIs-Google allow: /archive/1Q84 disallow: /archive/
Productos afectados Las preferencias de rastreo dirigidas al user-agent APIs-Google
afectan a la forma en que las APIs de Google envían mensajes de notificaciones push. AdsBot Mobile Web
-
User-agent en solicitudes HTTP Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt Token de user-agent en robots.txt AdsBot-Google-Mobile
Se ignora el user-agent global (
*
).Ejemplo de grupo de robots.txt user-agent: AdsBot-Google-Mobile allow: /archive/1Q84 disallow: /archive/
Productos afectados Las preferencias de rastreo dirigidas al user-agent AdsBot-Google-Mobile
afectan a la capacidad de Google Ads para comprobar la calidad de los anuncios de las páginas web. AdsBot
-
User-agent en solicitudes HTTP AdsBot-Google (+http://www.google.com/adsbot.html)
robots.txt Token de user-agent en robots.txt AdsBot-Google
Se ignora el user-agent global (
*
).Ejemplo de grupo de robots.txt user-agent: AdsBot-Google allow: /archive/1Q84 disallow: /archive/
Productos afectados Las preferencias de rastreo dirigidas al user-agent AdsBot-Google
afectan a la capacidad de Google Ads para comprobar la calidad de los anuncios de las páginas web. AdSense
-
User-agent en solicitudes HTTP User-agent en ordenadores Mediapartners-Google
User-agent en dispositivos móviles (Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)
robots.txt Token de user-agent en robots.txt Mediapartners-Google
Se ignora el user-agent global (
*
).Ejemplo de grupo de robots.txt user-agent: Mediapartners-Google allow: /archive/1Q84 disallow: /archive/
Productos afectados Las preferencias de rastreo dirigidas al user-agent Mediapartners-Google
afectan a Google AdSense. El rastreador de AdSense visita los sitios participantes para proporcionarles anuncios relevantes. Google-Safety
-
User-agent en solicitudes HTTP Google-Safety
robots.txt El user-agent Google-Safety ignora las reglas de robots.txt. Productos afectados El user-agent Google-Safety gestiona el rastreo específico de usos inadecuados, como la detección de malware en enlaces publicados de forma pública en las propiedades de Google. Por tanto, no se ve afectado por las preferencias de rastreo.
Rastreadores para casos especiales retirados
Los siguientes rastreadores para casos especiales ya no se utilizan y solo se indican aquí a modo de historial.
AdsBot Mobile Web
-
User-agent en solicitudes HTTP Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt Token de user-agent en robots.txt AdsBot-Google-Mobile
Se ignora el user-agent global (
*
).Productos afectados Las preferencias de rastreo dirigidas al user-agent AdsBot-Google-Mobile
afectaban a la capacidad de Google Ads para comprobar la calidad de los anuncios incluidos en las páginas web de los dispositivos iPhone. Duplex web
-
User-agent en solicitudes HTTP Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36
robots.txt Token de user-agent en robots.txt DuplexWeb-Google
Es posible que este rastreador ignore los comodines
*
.Productos afectados Admitía el servicio Duplex web. Google Favicon
-
User-agent en solicitudes HTTP Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon
robots.txt Token de user-agent en robots.txt Googlebot-Image
Googlebot
Mobile Apps Android
-
User-agent en solicitudes HTTP AdsBot-Google-Mobile-Apps
robots.txt Token de user-agent en robots.txt AdsBot-Google-Mobile-Apps
El user-agent
AdsBot-Google-Mobile-Apps
obedecía las reglas de robots deAdsBot-Google
, pero ignoraba el user-agent global (*
).Productos afectados Las preferencias de rastreo dirigidas al user-agent AdsBot-Google-Mobile-Apps
afectan a la capacidad de Google Ads para comprobar la calidad de los anuncios de las páginas de aplicaciones Android. Web Light
-
User-agent en solicitudes HTTP Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19
robots.txt Token de user-agent en robots.txt googleweblight
El user-agent de
googleweblight
solo se usaba cuando una persona solicitaba expresamente una página, por lo que ignoraba las reglas de robots.txt, que sirven para bloquear las solicitudes de rastreo automatizadas.Productos afectados El user-agent de Web Light comprobaba si estaba presente el encabezado no-transform
cuando un usuario hacía clic en tu página en la Búsqueda si se cumplían las condiciones adecuadas.