Sử dụng Tài khoản đăng nguồn cấp dữ liệu chung

Tài khoản đăng nguồn cấp dữ liệu chung cho phép tải nhiều loại nguồn cấp dữ liệu lên một một dropbox cho mỗi môi trường. Hướng dẫn này sẽ hướng dẫn cách sử dụng hộp thả dữ liệu chung và cung cấp đường liên kết đến hướng dẫn phù hợp cho nguồn cấp dữ liệu tương ứng mà bạn dự định sử dụng.

(Vui lòng tham khảo phần Xuất nguồn cấp dữ liệu (toàn diện) hoặc Nguồn cấp dữ liệu (bắt đầu) trong tài liệu).

Tài khoản đăng chung dựa vào hai tệp tải lên riêng biệt:

  1. Tệp mô tả: mô tả loại nguồn cấp dữ liệu mà bạn sẽ tải lên
  2. (Các) tệp nguồn cấp dữ liệu: nội dung của nguồn cấp dữ liệu thực tế

Cấu trúc trường mô tả

Tệp mô tả được tải lên để cho hệ thống của chúng tôi biết bạn dùng loại nguồn cấp dữ liệu nào đang tải lên. Điều này cho phép chúng tôi xác thực và xử lý nguồn cấp dữ liệu một cách chính xác. Chiến lược phát hành đĩa đơn tệp mô tả phải được tải lên trước nội dung nguồn cấp dữ liệu và phải tuân thủ các yêu cầu đặt tên sau:

  • Bạn phải sử dụng đuôi tệp .filesetdesc.json cho tệp mô tả.
  • Mỗi tên tệp nội dung mô tả phải là duy nhất và không được sử dụng lại trong các lần tải lên. T4 bạn nên đưa dấu thời gian tạo và tên nguồn cấp dữ liệu vào tên tệp.
    • Ví dụ: offers_1524606581.filesetdesc.json
  • Mỗi tệp mô tả phải liệt kê tất cả tệp dữ liệu trong nguồn cấp dữ liệu mới nhất cho tên nguồn cấp dữ liệu có liên quan.
message FilesetDescriptor {
  // The timestamp at which this feed was generated, in Unix time format
  // (seconds since the epoch). (required)
  int64 generation_timestamp = 1;

  // Identifies the name of this feed. (required)
  string name = 2;

  // Paths (relative to the dropbox root) specifying data files included in this
  // feed. (required)
  repeated string data_file = 3;
}

Trường name có thể mang các giá trị sau:

Tệp mô tả JSON mẫu cho nguồn cấp dữ liệu sản phẩm có hai phân đoạn là có sẵn bên dưới:

{
  "generation_timestamp": 1524606581,
  "name": "promote.offer",
  "data_file": [
    "offers_1524606581_1.json",
    "offers_1524606581_2.json"
  ]
}

Định cấu trúc nội dung nguồn cấp dữ liệu

Sau khi tải tệp mô tả lên, bạn sẽ tải tất cả các tệp nguồn cấp dữ liệu lên cho loại dữ liệu của nguồn cấp dữ liệu tương ứng với tệp cấu hình của nguồn cấp dữ liệu được đặt tên theo tệp mô tả của bạn. Tên tệp và vị trí đường dẫn (tương đối trong dropbox) phải khớp chính xác với nội dung có trong Trường data_file. Nếu thiếu tệp, tên tệp không chính xác hoặc tải lên một vị trí khác, thì toàn bộ nguồn cấp dữ liệu sẽ không được xử lý.

Nội dung của các tệp dữ liệu trong nguồn cấp dữ liệu này phải tuân thủ các thông số có liên quan của nguồn cấp dữ liệu được chỉ định trong tệp mô tả.

Mỗi tên tệp trong nguồn cấp dữ liệu phải là duy nhất và không thể dùng lại trong các lần tải lên. Bạn nên thêm dấu thời gian tạo và số phân đoạn (mã nhận dạng tăng dần) vào tên tệp.

  • Ví dụ: offer_1524606581_1.json

Kích thước tệp nguồn cấp dữ liệu và tần suất tải lên

  • Giữ kích thước tệp nguồn cấp dữ liệu dưới 200 MB (sau khi nén).
  • Mỗi kích thước tệp dữ liệu đã giải nén phải nhỏ hơn 2 GB.
  • Hầu hết các công cụ tích hợp sẽ chỉ cần sử dụng một phân đoạn duy nhất. Bạn nên sử dụng ít phân mảnh nhất có thể. Mỗi nguồn cấp dữ liệu có tối đa 1.000 phân đoạn.
  • Các bản ghi riêng lẻ được gửi trong một phân mảnh không cần phải được gửi trong cùng một số phân mảnh trong các nguồn cấp dữ liệu trong tương lai.
  • Để có hiệu suất tốt hơn, hãy chia đều dữ liệu giữa các phân đoạn, để làm cho tất cả các tệp phân đoạn có kích thước tương tự.
  • Nếu cần, hãy sử dụng gzip để nén nguồn cấp dữ liệu. Tuy nhiên, hãy làm như vậy cho từng mảnh nguồn cấp dữ liệu riêng lẻ.

Khắc phục sự cố và gỡ lỗi

Sau khi tải các tệp của bạn (tệp mô tả và tệp nguồn cấp dữ liệu), hãy truy cập vào Trang tổng quan Nhật ký nguồn cấp dữ liệu (tài liệu) trên Cổng đối tác (chuyển đến Nhật ký > Nguồn cấp dữ liệu) để theo dõi tiến trình nhập nguồn cấp dữ liệu của bạn.

Tìm name mà bạn đã nhập trong tệp mô tả trong "Tên nguồn cấp dữ liệu" để tìm nguồn cấp dữ liệu của bạn.

Sau khi nguồn cấp dữ liệu được nhập (trạng thái là Success hoặc Fail), bạn có thể nhấp vào hàng của nguồn cấp dữ liệu đó để xem thông tin chi tiết về các lỗi và cảnh báo.