使用通用的 Feed Dropbox

借助通用 Feed Dropbox,您可以将多个 Feed 类型上传到每个环境的单个 Dropbox。本指南将详细介绍如何使用通用 Dropbox,并提供指向您计划使用的相应 Feed 的适用指南的链接。

(请参阅文档中的导出 Feed(端到端)Feed(入门)部分)。

通用 Dropbox 需要进行两次单独的上传:

  1. 描述文件:描述您要上传的 Feed 类型
  2. Feed 文件:实际 Feed 的内容

描述符字段的结构

上传描述符文件是为了告知我们的系统您上传的是哪种类型的 Feed。这样,我们才能正确验证和处理 Feed。描述符文件应先于 Feed 内容上传,并且必须遵循以下命名要求:

  • 您必须为描述符文件使用 .filesetdesc.json 文件扩展名。
  • 每个描述符文件名都必须是唯一的,并且不能在多次上传中重复使用。我们建议您在文件名中添加生成时间戳和 Feed 名称。
    • 示例:offers_1524606581.filesetdesc.json
  • 每个描述符文件都必须列出最新 Feed 中相应 Feed 名称的所有数据文件。
message FilesetDescriptor {
  // The timestamp at which this feed was generated, in Unix time format
  // (seconds since the epoch). (required)
  int64 generation_timestamp = 1;

  // Identifies the name of this feed. (required)
  string name = 2;

  // Paths (relative to the dropbox root) specifying data files included in this
  // feed. (required)
  repeated string data_file = 3;
}

name 字段的可能值包括:

  • reservewithgoogle.entity
  • reservewithgoogle.action.v2

以下是包含两个分片的商品 Feed 的 JSON 描述符文件示例:

{
  "generation_timestamp": 1524606581,
  "name": "promote.offer",
  "data_file": [
    "offers_1524606581_1.json",
    "offers_1524606581_2.json"
  ]
}

构建 Feed 内容的结构

上传描述文件后,您需要上传与描述文件中命名的 Feed 配置文件对应的 Feed 数据类型的所有 Feed 文件。文件名和路径位置(相对于保管箱)必须与 data_file 字段中包含的内容完全一致。如果任何文件缺失、命名不当或上传到其他位置,系统将不会处理整个 Feed。

这些 Feed 数据文件的内容必须符合描述符文件中指定的 Feed 的相关规范。

每个 Feed 文件的文件名都必须是唯一的,并且不能在多次上传中重复使用。我们建议您在文件名中添加生成时间戳和分片编号(增量 ID)。

  • 示例:offers_1524606581_1.json

Feed 文件大小和上传频率

  • 确保 Feed 文件小于 200 MB(压缩后)。
  • 每个解压缩数据文件的大小不得超过 2 GB。
  • 大多数集成只需使用一个分片。您应尽可能少用分片。每个 Feed 最多可包含 1000 个分片。
  • 在一个分片中发送的各个记录无需在未来 Feed 中的同一分片编号中发送。
  • 为实现更好的性能,您应将数据平均分到各个分片,使所有分片文件的大小相近。
  • 如有必要,请使用 gzip 压缩 Feed。但是,请分别对每个 Feed 分片执行压缩操作。

问题排查和调试

上传文件(描述符和 Feed 文件)后,前往合作伙伴门户上的 Feed 历史记录信息中心文档)(依次前往历史记录 > Feed),跟踪 Feed 提取进度。

在“Feed 名称”列中,查找您在描述符文件中输入的 name,以找到您的 Feed。

Feed 提取完毕(状态为 SuccessFail)后,您可以点击其行以查看错误和警告的详细信息。