Sử dụng Tài khoản đăng nguồn cấp dữ liệu chung

Tài khoản đăng nguồn cấp dữ liệu chung cho phép tải nhiều loại nguồn cấp dữ liệu lên một tài khoản đăng duy nhất trong mỗi môi trường. Phần này giới thiệu cách sử dụng Tài khoản đăng chung và các đường liên kết đến tài liệu hướng dẫn phù hợp với nguồn cấp dữ liệu tương ứng mà bạn định sử dụng.

(Vui lòng tham khảo phần Xuất nguồn cấp dữ liệu (từ đầu đến cuối) hoặc Nguồn cấp dữ liệu (trình bắt đầu) trong tài liệu).

Tài khoản đăng chung dựa trên hai nội dung tải lên riêng biệt:

  1. Tệp mô tả: mô tả loại nguồn cấp dữ liệu mà bạn sẽ tải lên
  2. (Các) tệp nguồn cấp dữ liệu: nội dung của nguồn cấp dữ liệu thực tế

Cấu trúc trường mô tả

Tệp mô tả được tải lên để cho hệ thống của chúng tôi biết loại nguồn cấp dữ liệu mà bạn đang tải lên. Việc này cho phép chúng tôi xác thực và xử lý nguồn cấp dữ liệu một cách chính xác. Tệp mô tả phải được tải lên trước nội dung nguồn cấp dữ liệu và phải tuân theo các yêu cầu đặt tên sau đây:

  • Dùng đuôi tệp .filesetdescription.json
  • Mỗi tên tệp mô tả phải là duy nhất và không thể sử dụng lại cho các nội dung tải lên. Bạn nên thêm dấu thời gian tạo vào tên tệp.
    • Ví dụ: offer_1524606581.filesetdescription.json
message FilesetDescriptor {
  // The timestamp at which this feed was generated, in Unix time format
  // (seconds since the epoch). (required)
  int64 generation_timestamp = 1;

  // Identifies the name of this feed. (required)
  string name = 2;

  // Paths (relative to the dropbox root) specifying data files included in this
  // feed. (required)
  repeated string data_file = 3;
}

Trường name có thể có các giá trị sau:

Dưới đây là ví dụ về tệp mô tả JSON cho nguồn cấp dữ liệu mặt hàng có 2 phân đoạn:

{
  "generation_timestamp": 1524606581,
  "name": "promote.offer",
  "data_file": [
    "offers_1524606581_1.json",
    "offers_1524606581_2.json"
  ]
}

Cấu trúc nội dung nguồn cấp dữ liệu

Sau khi tải tệp mô tả lên, bạn sẽ tải tất cả các tệp nguồn cấp dữ liệu lên cho loại dữ liệu của nguồn cấp dữ liệu tương ứng với tệp cấu hình nguồn cấp dữ liệu do tệp mô tả của bạn đặt tên. Tên tệp và vị trí đường dẫn (tương đối trong tài khoản dropbox) phải khớp chính xác với nội dung trong trường data_file. Nếu một tệp nào đó bị thiếu, đặt tên không chính xác hoặc được tải lên một vị trí khác, thì toàn bộ nguồn cấp dữ liệu sẽ không được xử lý.

Nội dung của các tệp dữ liệu của nguồn cấp dữ liệu này phải tuân thủ quy cách liên quan của nguồn cấp dữ liệu đã được chỉ định trong tệp mô tả.

Mỗi tên tệp nguồn cấp dữ liệu phải là duy nhất và không thể sử dụng lại cho các lần tải lên. Bạn nên thêm dấu thời gian tạo và số phân đoạn (mã nhận dạng tăng dần) vào tên tệp.

  • Ví dụ: offer_1524606581_1.json

Kích thước tệp nguồn cấp dữ liệu và tần suất tải lên

  • Giữ cho tệp nguồn cấp dữ liệu có kích thước dưới 200 MB (sau khi nén).
  • Hầu hết các chế độ tích hợp sẽ chỉ cần sử dụng một phân đoạn duy nhất. Bạn nên sử dụng càng ít phân đoạn càng tốt. Có tối đa 1.000 phân đoạn cho mỗi nguồn cấp dữ liệu.
  • Các bản ghi riêng lẻ được gửi trong một phân đoạn không cần phải được gửi cùng một số phân đoạn trong các nguồn cấp dữ liệu sau này.
  • Để có hiệu suất tốt hơn, hãy chia dữ liệu đồng đều giữa các phân đoạn để làm cho tất cả các tệp phân đoạn có kích thước tương tự nhau.
  • Nếu cần, hãy sử dụng gzip để nén nguồn cấp dữ liệu. Tuy nhiên, hãy làm như vậy đối với từng phân đoạn nguồn cấp dữ liệu riêng lẻ.

Khắc phục sự cố và gỡ lỗi

Sau khi tải tệp của bạn lên (tệp mô tả và tệp nguồn cấp dữ liệu), hãy chuyển đến trang tổng quan Nhật ký nguồn cấp dữ liệu (tài liệu) trên Cổng đối tác (chuyển đến Nhật ký > Nguồn cấp dữ liệu) để theo dõi tiến trình nhập nguồn cấp dữ liệu của bạn.

Tìm name mà bạn đã nhập trong tệp mô tả trong cột "Tên nguồn cấp dữ liệu" để tìm nguồn cấp dữ liệu của bạn.

Sau khi nhập nguồn cấp dữ liệu (trạng thái là Success hoặc Fail), bạn có thể nhấp vào hàng của nguồn cấp dữ liệu đó để xem thông tin chi tiết về lỗi và cảnh báo.