Nguyên tắc về tệp nguồn cấp dữ liệu

Phần này mô tả tệp nguồn cấp dữ liệu giản đồ XML, bao gồm định dạng tệp, quy ước đặt tên, kích thước, số lượng và tần suất tạo tệp.

Định dạng và đuôi tệp

Bắt buộc

  • Định dạng tệp phải là XML hoặc GZIP (giải nén thành XML). Tất cả các định dạng tệp khác sẽ không được xử lý.
  • Đuôi tệp phải là .xml (đối với tệp XML chưa nén) hoặc .gz (đối với tệp GZIP nén).

Đề xuất

  • Bạn có thể sử dụng định dạng tệp XML và GZIP, tuy nhiên, nhà xuất bản nên gửi tệp XML chưa nén.

Tên tệp

Đề xuất

  • Tên tệp phải có dấu thời gian cho biết thời điểm tệp được tạo.

Kích thước tệp

Bắt buộc

  • Nhà xuất bản không được gửi tệp trống cho Google. Google sẽ ngừng xử lý nguồn cấp dữ liệu của bạn nếu tệp nguồn cấp dữ liệu trống.

Đề xuất

  • Google khuyến nghị mỗi tệp nguồn cấp dữ liệu XML không được lớn hơn 500M. Nếu một tệp XML được nén ở định dạng GZIP, thì tệp XML gốc không được lớn hơn 500M.

Số lượng Tệp

Đề xuất

  • Nhóm các bài đánh giá vào một tệp duy nhất, miễn là kích thước tệp nguồn cấp dữ liệu không vượt quá 500M.

Đề xuất về tần suất và thời gian tạo nguồn cấp dữ liệu

Bắt buộc

  • Tạo nguồn cấp dữ liệu gia tăng mỗi ngày.
  • Giữ ít nhất 60 ngày dữ liệu trong thư mục mà hệ thống của chúng tôi tìm nạp tệp nguồn cấp dữ liệu.

Đề xuất

  • Google tìm nạp nguồn cấp dữ liệu hằng ngày lúc 12:00 UTC, vì vậy, nhà xuất bản nên tạo nguồn cấp dữ liệu lúc 10:00 UTC.