Search Console sắp ngừng cung cấp Công cụ giới hạn tốc độ thu thập dữ liệu
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Thứ Sáu, ngày 24 tháng 11 năm 2023
Công cụ giới hạn tốc độ thu thập dữ liệu trong Search Console sẽ ngừng hoạt động kể từ ngày 8 tháng 1 năm 2024. Công cụ này đã ra mắt được hơn một thập kỷ, nhưng với những cải tiến của chúng tôi đối với logic thu thập dữ liệu và các công cụ khác hiện có cho nhà xuất bản, công cụ này không còn hữu ích nữa.
Googlebot phản ứng với cách trang web (hay cụ thể hơn là máy chủ xử lý trang web) phản hồi các yêu cầu HTTP của Googlebot. Ví dụ: nếu máy chủ liên tục trả về mã trạng thái HTTP
500
cho một loạt URL, thì Googlebot sẽ tự động và gần như
ngay lập tức giảm tốc độ thu thập dữ liệu. Tương tự, Googlebot tự động giảm tốc độ nếu thời gian phản hồi các yêu cầu lâu hơn đáng kể. Nếu bạn gặp phải tình trạng thu thập dữ liệu ở mức cao bất thường đến mức trang web của bạn không thể tự quản lý được, hãy tham khảo bài viết trợ giúp này.
Ngược lại, công cụ giới hạn tốc độ có tác động chậm hơn nhiều; trên thực tế, có thể mất hơn một ngày mới áp dụng được các giới hạn mới cho hoạt động thu thập dữ liệu. Tuy nhiên, rất may là các chủ sở hữu trang web hiếm khi phải dùng đến công cụ này. Trong khi đó, những người phải dùng đến công cụ này lại đặt tốc độ thu thập dữ liệu về mức tối thiểu.
Khi công cụ giới hạn thu thập dữ liệu ngừng hoạt động, chúng tôi cũng sẽ thiết lập tốc độ thu thập dữ liệu tối thiểu xuống mức thấp hơn, tương đương với các giới hạn tốc độ thu thập dữ liệu trước đây. Tức là chúng tôi sẽ tiếp tục tuân thủ triệt để các chế độ cài đặt mà một số chủ sở hữu trang web thiết lập trước đây nếu lượng tìm kiếm không lớn và trình thu thập dữ liệu của chúng tôi sẽ không làm lãng phí băng thông của trang web.
Do những tiến bộ trong việc xử lý tốc độ thu thập dữ liệu tự động và trên tinh thần đơn giản hoá mọi thứ cho người dùng, chúng tôi sẽ ngừng cung cấp công cụ này trong Search Console. Chúng tôi vẫn giữ biểu mẫu báo cáo về Googlebot để báo cáo những hoạt động bất thường của Googlebot cũng như các trường hợp khẩn cấp, nhưng xin lưu ý rằng cách nhanh nhất để giảm tốc độ thu thập dữ liệu là hướng dẫn Googlebot thông qua các phản hồi của máy chủ (chi tiết có trong tài liệu của chúng tôi).
Nếu bạn có thắc mắc hoặc bình luận, hãy đăng lên Cộng đồng Trung tâm Google Tìm kiếm.
Người đăng: Gary Illyes và Nir Kalush
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
[null,null,[],[[["\u003cp\u003eThe crawl rate limiter tool in Google Search Console will be deprecated on January 8, 2024, due to advancements in Google's crawling technology.\u003c/p\u003e\n"],["\u003cp\u003eGooglebot automatically adjusts its crawl rate based on website and server responses, like HTTP errors or slow response times.\u003c/p\u003e\n"],["\u003cp\u003eFor persistent crawling issues, refer to the provided help article for guidance on reducing Googlebot's crawl rate.\u003c/p\u003e\n"],["\u003cp\u003eSite owners experiencing unusually high crawl rates are encouraged to use the Googlebot report form for assistance.\u003c/p\u003e\n"],["\u003cp\u003eWhile the crawl rate limiter is being removed, Google will still honor previously set limits for sites with low search interest.\u003c/p\u003e\n"]]],["The Search Console's crawl rate limiter tool will be removed on January 8th, 2024. Googlebot now automatically adjusts crawling speed based on server responses, slowing down with HTTP `500` errors or increased response times. The tool's impact was slow, and it was rarely used. The minimum crawl speed will be reduced to match previous limits. While the tool is deprecated, reporting unusual Googlebot activity remains available via a report form, but the fastest way to adjust crawl rate is through server responses.\n"],null,["# Upcoming deprecation of Crawl Rate Limiter Tool in Search Console\n\nFriday, November 24, 2023\n\n\nThe crawl rate limiter tool in Search Console is being deprecated on Jan 8th, 2024. This tool has\nbeen\n[available for over a decade](/search/blog/2008/12/more-control-of-googlebots-crawl-rate),\nbut with the improvements we've made to our crawling logic and other tools available to\npublishers, its usefulness has dissipated.\n\n\nGooglebot reacts to how the site--or more specifically the server handling the site--\nresponds to Googlebot's HTTP requests. For example, if the server persistently returns HTTP\n`500` status codes for a range of URLs, Googlebot will automatically, and almost\nimmediately slow down crawling. Similarly, Googlebot slows down automatically if the response time\nfor requests gets significantly longer. If you do experience unusually heavy crawling that your\nsite can't manage on its own, refer to this\n[help article](/search/docs/crawling-indexing/reduce-crawl-rate).\n\n\nIn contrast, the rate limiter tool had a much slower effect; in fact it may have taken over a day\nfor the new limits to be applied on crawling. Fortunately though, site owners rarely had to resort\nto using the tool, and those who have, in many cases set the crawling speed to the bare minimum.\nWith the deprecation of the crawl limiter tool, we're also setting the minimum crawling speed to a\nlower rate, comparable to the old crawl rate limits. This means that we effectively continue\nhonoring the settings that some site owners have set in the past if the Search interest is low,\nand our crawlers don't waste the site's bandwidth.\n\n\nBecause of the advances in the automated crawl rate handling, and in the spirit of keeping things\nsimple for users, we'll be deprecating this tool in Search Console. We are keeping the Googlebot\n[report form](/search/docs/crawling-indexing/reduce-crawl-rate) for reporting unusual\nGooglebot activities and for emergency cases, but keep in mind that the fastest way to reduce\ncrawl rate is to instruct Googlebot through server responses as detailed in\n[our documentation](/search/docs/crawling-indexing/reduce-crawl-rate).\n\n\nIf you have questions or comments, write in our\n[Google Search Central Community](https://support.google.com/webmasters/community).\n\nPosted by [Gary Illyes](/search/blog/authors/gary-illyes) and [Nir Kalush](/search/blog/authors/nir-kalush)"]]