Thứ Hai, ngày 26 tháng 6 năm 2023
Giao thức Sơ đồ trang web ra mắt năm 2005 nhằm giúp các công cụ tìm kiếm phát hiện ra URL mới và cũng giúp lên lịch thu thập dữ liệu mới cho các URL đã được phát hiện. Đây là một giao thức cực kỳ phổ biến và không thay đổi trong hơn 15 năm. Nhìn chung, ý tưởng này vẫn hữu ích, nhưng trong thực tế Internet hiện nay thì một số khía cạnh không còn thiết thực như trước.
Do đó, chúng tôi xin thông báo về việc ngừng sử dụng điểm cuối "ping" của sơ đồ trang web và bổ sung đề xuất về việc sử dụng phần tử lastmod
.
Ping sơ đồ trang web
Giao thức sơ đồ trang web xác định một phương thức REST chưa được xác thực để gửi sơ đồ trang web cho các công cụ tìm kiếm. Các nghiên cứu nội bộ của chúng tôi (và cả các công cụ tìm kiếm khác như Bing) cho chúng tôi thấy rằng hiện tại, việc gửi sơ đồ trang web chưa xác thực này không thực sự hữu ích. Trên thực tế, trong trường hợp của Google Tìm kiếm, phần lớn nội dung gửi đó dẫn tới nội dung rác. Vậy nên, chúng tôi sẽ ngừng hỗ trợ ping sơ đồ trang web và điểm cuối này sẽ ngừng hoạt động sau 6 tháng nữa. Bạn vẫn có thể gửi sơ đồ trang web qua tệp robots.txt và Search Console, nhưng các yêu cầu HTTP ("ping") đến điểm cuối REST không dùng nữa sẽ dẫn đến kết quả 404
. Mọi đoạn mã hoặc trình bổ trợ hiện có sử dụng điểm cuối này sẽ không gây ra vấn đề cho Google Tìm kiếm; bạn không cần thực hiện thay đổi nào (nhưng việc sử dụng điểm cuối này dù sao cũng sẽ không hữu ích).
Phần tử lastmod
Những năm qua, chúng tôi nhận thấy mức độ hữu ích của phần tử lastmod
trên các trang web cung cấp phần tử này. Đây có thể là kết quả của loại nội dung đã xuất bản, hoặc có lẽ là do hệ thống quản lý nội dung, nhưng hiện nay, lastmod
thực sự hữu ích và được dùng trong nhiều trường hợp. Hiện chúng tôi dùng phần tử này làm tín hiệu để lên lịch thu thập dữ liệu trên những URL từng được chúng tôi phát hiện.
Để phần tử lastmod
trở nên hữu ích, trước tiên, phần tử đó phải ở một định dạng ngày được hỗ trợ (theo tài liệu trên sitemaps.org); sau khi bạn gửi sơ đồ trang web, Search Console sẽ cho bạn biết nếu phần tử bạn gửi không đúng định dạng. Thứ hai, phần tử này phải phù hợp với thực tế: nếu trang của bạn thay đổi 7 năm trước, nhưng bạn cho chúng tôi biết trong phần tử lastmod
rằng trang mới thay đổi hôm qua, thì cuối cùng chúng tôi sẽ không tin tưởng bạn nữa về ngày gần nhất sửa đổi trang.
Bạn có thể dùng phần tử lastmod
cho mọi trang trong sơ đồ trang web, hoặc chỉ những trang mà bạn thấy chắc chắn. Ví dụ: một số phần mềm trang web có thể không dễ dàng cho biết được ngày sửa đổi gần đây nhất của trang chủ hoặc trang danh mục vì chỉ đơn thuần là tổng hợp các trang khác trên trang web. Trong những trường hợp như vậy, bạn có thể bỏ qua lastmod
cho các trang đó.
"Lần sửa đổi gần đây nhất" ở đây có nghĩa là "lần sửa đổi đáng kể gần đây nhất". Nếu CMS của bạn thay đổi một đoạn văn bản không đáng kể trong thanh bên hoặc chân trang, thì bạn không cần cập nhật giá trị lastmod
cho trang đó.
Tuy nhiên, nếu bạn thay đổi văn bản chính, thêm hoặc thay đổi dữ liệu có cấu trúc hoặc cập nhật một số đường liên kết, hãy cập nhật giá trị lastmod
.
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <lastmod>2005-01-01</lastmod> <loc>http://www.example.com/</loc> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
Một vấn đề nhỏ nữa, nếu nhìn vào thuộc tính xmlns
trong đoạn mã sơ đồ trang web, bạn sẽ thấy URI đó nằm trên HTTP, chứ không phải trên HTTPS. Việc này đúng như dự kiến: đây là tệp tham chiếu cho các trình phân tích cú pháp về các phần tử trong đoạn mã XML. Vui lòng không gửi thêm ý kiến phản hồi trên tài liệu về vấn đề này.
changefreq
và priority
Google vẫn hoàn toàn không sử dụng các phần tử changefreq
hoặc priority
.
Cụ thể, changefreq
cũng trùng lặp về mặt khái niệm với lastmod
.
Phần tử priority
là một trường nặng tính chủ quan và dựa trên các nghiên cứu nội bộ của chúng tôi, thường không phản ánh chính xác mức độ ưu tiên thực tế của một trang so với các trang khác trên một trang web.
Bạn có muốn đọc thêm về sơ đồ trang web không? Hãy tham khảo tài liệu của chúng tôi, và sitemaps.org. Nếu muốn trò chuyện với chúng tôi về sơ đồ trang web, bạn có thể liên hệ với chúng tôi trên diễn đàn của Trung tâm Google Tìm kiếm và trên Twitter.