Google 如何抓取语言区域自适应网页
如果您的网站包含语言区域自适应网页(也就是说,您的网站会根据检测到的访问者所在国家/地区或访问者首选语言返回不同的内容),Google 可能不会将您的不同语言区域网页的所有内容都纳入抓取/索引/排名范围。这是因为,Googlebot 抓取工具的默认 IP 地址看起来是位于美国境内的。另外,该抓取工具在发送 HTTP 请求时并不会在请求标头中设置 Accept-Language
。
基于地理位置的抓取
除了使用美国境内的 IP 地址之外,Googlebot 还会使用美国境外的 IP 地址进行抓取。
正如我们一直建议的,当 Googlebot 看似来自特定国家/地区时,请像对待来自该国家/地区的任何其他用户一样对待它。这意味着,如果您阻止位于美国的用户访问您的内容,但允许来自澳大利亚的用户访问,那么您的服务器就应该阻止看似来自美国的 Googlebot 访问,但允许看似来自澳大利亚的 Googlebot 访问。
其他注意事项
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-02-17。
[null,null,["最后更新时间 (UTC):2025-02-17。"],[[["Googlebot's default IP addresses appear to be US-based, which may impact the crawling and indexing of locale-adaptive pages targeting other regions."],["It is recommended to use separate locale URL configurations with `rel=\"alternate\"` hreflang annotations for better localization."],["Googlebot crawls from various global locations, so treat it like any other user based on its apparent location, including access restrictions."],["Ensure consistent robots exclusion protocol (robots.txt and meta tags) across all locales to avoid unintended crawling restrictions."]]],["Google crawls locale-adaptive pages using IP addresses from various locations, not just the USA. When Googlebot appears to be from a specific country, treat it like a user from that region. For locale-adaptive sites, using separate URL configurations with `rel=\"alternate\"` hreflang annotations is recommended. Ensure consistent application of robots exclusion protocols, such as robots.txt and meta tags, across all locales. You can verify Googlebot's geo-distributed crawls through reverse DNS lookups.\n"]]