Liste der gesonderten Crawler von Google

Die gesonderten Crawler werden von bestimmten Google-Produkten verwendet, wenn es eine Vereinbarung zwischen der gecrawlten Website und dem Produkt über den Crawling-Prozess gibt. Beispielsweise ignoriert AdsBot den globalen robots.txt-User-Agent (*) mit der Berechtigung des Anzeigen-Publishers. Die allgemeinen technischen Eigenschaften der Google-Crawler gelten auch für gesonderte Crawler.

Die gesonderten Crawler können robots.txt-Regeln ignorieren, sodass sie von einem anderen IP-Bereich als die gängigen Crawlern arbeiten. Die IP-Bereiche werden im Objekt special-crawlers.json veröffentlicht. Die umgekehrte DNS-Maske der gesonderten Crawler stimmt mit rate-limited-proxy-***-***-***-***.google.com überein.

Die folgende Liste enthält die gesonderten Crawler, ihre User-Agent-Strings, wie sie in den HTTP-Anfragen erscheinen, ihre User-Agent-Tokens für die Zeile User-agent: in robots.txt und die Produkte, die von den Crawling-Einstellungen für den Crawler betroffen sind. Die Liste ist nicht vollständig. Sie umfasst nur die Anfragesteller, die mit höherer Wahrscheinlichkeit in Protokolldateien vorkommen und zu denen wir Fragen erhalten haben.

User-Agent in HTTP-Anfragen
APIs-Google (+https://developers.google.com/webmasters/APIs-Google.html)
robots.txt
User-Agent-Token in robots.txt

APIs-Google


Der globale User-Agent (*) wird ignoriert.

Beispiel für eine robots.txt-Gruppe
user-agent: APIs-Google
allow: /archive/1Q84
disallow: /archive/
Betroffene Produkte Crawling-Einstellungen, die an den User-Agent APIs-Google gerichtet sind, wirken sich auf die Zustellung von Push-Benachrichtigungen durch Google APIs aus.
User-Agent in HTTP-Anfragen
Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt
User-Agent-Token in robots.txt

AdsBot-Google-Mobile


Der globale User-Agent (*) wird ignoriert.

Beispiel für eine robots.txt-Gruppe
user-agent: AdsBot-Google-Mobile
allow: /archive/1Q84
disallow: /archive/
Betroffene Produkte Crawling-Einstellungen, die an den User-Agent AdsBot-Google-Mobile gerichtet sind, wirken sich darauf aus, ob in Google Ads die Anzeigenqualität auf Webseiten überprüft werden kann.
User-Agent in HTTP-Anfragen
AdsBot-Google (+http://www.google.com/adsbot.html)
robots.txt
User-Agent-Token in robots.txt

AdsBot-Google


Der globale User-Agent (*) wird ignoriert.

Beispiel für eine robots.txt-Gruppe
user-agent: AdsBot-Google
allow: /archive/1Q84
disallow: /archive/
Betroffene Produkte Crawling-Einstellungen, die an den User-Agent AdsBot-Google gerichtet sind, wirken sich auf die Möglichkeit von Google Ads aus, die Anzeigenqualität auf Webseiten zu prüfen.
User-Agent in HTTP-Anfragen
Computer-Agent:
Mediapartners-Google
Mobilgeräte-Agent:
(Various mobile device types) (compatible; Mediapartners-Google/2.1; +http://www.google.com/bot.html)
robots.txt
User-Agent-Token in robots.txt Mediapartners-Google

Der globale User-Agent (*) wird ignoriert.

Beispiel für eine robots.txt-Gruppe
user-agent: Mediapartners-Google
allow: /archive/1Q84
disallow: /archive/
Betroffene Produkte Crawling-Einstellungen, die an den User-Agent Mediapartners-Google gerichtet sind, wirken sich auf Google AdSense aus. Der AdSense-Crawler greift auf teilnehmende Websites zu, um ihnen relevante Anzeigen zu präsentieren.
User-Agent in HTTP-Anfragen
Google-Safety
robots.txt Der Google-Sicherheit-User-Agent ignoriert robots.txt-Regeln.
Betroffene Produkte Der Google-Sicherheit-User-Agent kümmert sich um missbrauchsspezifisches Crawling, z. B. die Erkennung von Malware für öffentlich gepostete Links in Google-Produkten. Daher sind sie von den Crawling-Einstellungen nicht betroffen.

Eingestellte gesonderte Crawler

Die folgenden gesonderten Crawler werden nicht mehr verwendet und sind hier nur zu Referenzzwecken aufgeführt.

User-Agent in HTTP-Anfragen
Mozilla/5.0 (iPhone; CPU iPhone OS 14_7_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.2 Mobile/15E148 Safari/604.1 (compatible; AdsBot-Google-Mobile; +http://www.google.com/mobile/adsbot.html)
robots.txt
User-Agent-Token in robots.txt AdsBot-Google-Mobile

Der globale User-Agent (*) wird ignoriert.

Betroffene Produkte Crawling-Einstellungen, die an den User-Agent AdsBot-Google-Mobile gerichtet sind, haben die Möglichkeit beeinträchtigt, in Google Ads die Anzeigenqualität auf Webseiten auf iPhones zu prüfen.
User-Agent in HTTP-Anfragen
Mozilla/5.0 (Linux; Android 11; Pixel 2; DuplexWeb-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.193 Mobile Safari/537.36
robots.txt
User-Agent-Token in robots.txt DuplexWeb-Google

Duplex im Web kann den Platzhalter * ignorieren.

Betroffene Produkte Hat den Dienst „Duplex im Web“ unterstützt.
User-Agent in HTTP-Anfragen
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.75 Safari/537.36 Google Favicon
robots.txt
User-Agent-Token in robots.txt Googlebot-Image
Googlebot
User-Agent in HTTP-Anfragen
AdsBot-Google-Mobile-Apps
robots.txt
User-Agent-Token in robots.txt AdsBot-Google-Mobile-Apps

Der AdsBot-Google-Mobile-Apps-User-Agent befolgte die AdsBot-Google-Robots-Regeln, ignorierte aber den globalen User-Agent (*).

Betroffene Produkte Crawling-Einstellungen, die an den User-Agent AdsBot-Google-Mobile-Apps gerichtet sind, wirken sich darauf aus, ob in Google Ads die Anzeigenqualität auf Seiten in Android-Apps geprüft werden kann.
User-Agent in HTTP-Anfragen
Mozilla/5.0 (Linux; Android 4.2.1; en-us; Nexus 5 Build/JOP40D) AppleWebKit/535.19 (KHTML, like Gecko; googleweblight) Chrome/38.0.1025.166 Mobile Safari/535.19
robots.txt
User-Agent-Token in robots.txt googleweblight

Der googleweblight-User-Agent wurde nur für Suchanfragen eines menschlichen Besuchers verwendet und hat daher robots.txt-Regeln ignoriert, mit denen sonst automatisierte Crawling-Anfragen blockiert werden.

Betroffene Produkte Der Web Light-User-Agent hat immer dann geprüft, ob der Header no-transform vorhanden ist, wenn ein Nutzer unter entsprechenden Bedingungen in der Suche auf Ihre Seite geklickt hat.