减慢 Google 抓取速度

Google 抓取工具基础架构采用先进的算法来确定网站的最佳抓取速度。我们的目标是,每次访问您的网站时都尽可能多地抓取网页,但不会过多地占用服务器的带宽。在某些情况下,Google 抓取您的网站可能会给您的基础架构带来沉重负载,或在服务中断期间产生不必要的费用。为了避免这种情况,您可以决定减少 Google 抓取工具发出的请求数量。

了解导致抓取量急剧增加的原因

抓取速度急剧提升可能是由于您网站的结构效率低下或网站存在其他问题。根据我们过去收到的报告,最常见的原因包括:

  • 网站上网址的配置效率低下,这通常是由网站的特定功能导致的:
    • 网站的分面导航或其他排序和过滤功能
    • 包含特定日期的大量网址的日历
  • 动态搜索广告定位条件

我们强烈建议您与托管公司联系,并查看服务器的近期访问日志,以了解流量的来源,并了解是否符合上述导致抓取量急剧增加的常见原因。然后,请参阅我们关于管理对分面导航网址的抓取优化抓取效率的指南。

紧急减少抓取器流量(紧急情况)

如果您急需让抓取速度在短时间(如几个小时或 1-2 天)内减慢,则应向抓取请求返回 500503429 HTTP 响应状态代码(而非 200)。在遇到大量包含 500503429 HTTP 响应状态代码的网址时(例如,如果您停用了您的网站),Google 的抓取基础架构会减慢对您网站的抓取速度。 抓取速度减慢会影响您网站的整个主机名(例如 subdomain.example.com),同时影响对会返回错误的网址和会返回内容的网址的抓取。这些错误的数量减少后,抓取速度会自动重新开始提升。

降低抓取速度的特殊请求

如果向 Google 抓取工具提供错误之举在您的基础架构上不可行,您可提交特殊请求,报告抓取速度异常偏高的相关问题,并在请求中提及您网站的最佳抓取速度。您不能请求提高抓取速度,并且请求可能需要几天时间才能得到评估和满足。