Nguyên tắc về tệp nguồn cấp dữ liệu

Phần này mô tả tệp nguồn cấp dữ liệu giản đồ XML, bao gồm cả định dạng tệp, quy ước đặt tên, kích thước, số liệu và tần suất tạo tệp.

Tiện ích và định dạng tệp

Bắt buộc

  • Định dạng tệp phải là XML hoặc GZIP giải nén thành XML. Hệ thống sẽ không xử lý mọi định dạng tệp khác.
  • Đuôi tệp phải là .xml (đối với tệp XML chưa nén) hoặc .gz (đối với tệp GZIP nén).

Đề xuất

  • Các định dạng tệp XML và GZIP có thể chấp nhận được. Tuy nhiên, nhà xuất bản nên gửi tệp XML chưa nén.

Tên tệp

Đề xuất

  • Tên tệp phải chứa dấu thời gian cho biết thời điểm tạo tệp.

Kích thước tệp

Bắt buộc

  • Nhà xuất bản không được gửi cho Google một tệp trống. Google sẽ ngừng xử lý nguồn cấp dữ liệu của bạn nếu có tệp nguồn cấp dữ liệu trống.

Đề xuất

  • Google đề xuất mỗi tệp nguồn cấp dữ liệu XML không được lớn hơn 500 triệu. Nếu tệp XML được nén ở định dạng GZIP thì tệp XML gốc không được lớn hơn 500M.

Số lượng tệp

Đề xuất

  • Nhóm các bài đánh giá vào một tệp duy nhất, miễn là kích thước tệp nguồn cấp dữ liệu không vượt quá 500 triệu.

Đề xuất thời gian và tần suất tạo nguồn cấp dữ liệu

Bắt buộc

  • Tạo nguồn cấp dữ liệu tăng dần mỗi ngày.
  • Lưu giữ dữ liệu trong ít nhất 60 ngày trong thư mục mà hệ thống của chúng tôi tìm nạp tệp nguồn cấp dữ liệu.

Đề xuất

  • Google tìm nạp nguồn cấp dữ liệu lúc 12 giờ trưa hằng ngày theo giờ UTC. Do đó, nhà xuất bản nên tạo nguồn cấp dữ liệu lúc 10 giờ sáng (theo giờ UTC).