Truyền dẫn hàng loạt

Nguồn cấp dữ liệu cho phép bạn cung cấp nhà hàng, dịch vụ và thực đơn trong tính năng Đặt món toàn diện.

Tài liệu này trình bày cách lưu trữ kho hàng trong hộp cát và kho hàng thực tế, cũng như cách sử dụng tính năng truyền dẫn hàng loạt để cập nhật kho hàng trong tính năng Đặt hàng toàn diện.

Môi trường nguồn cấp dữ liệu

Có 3 môi trường nguồn cấp dữ liệu để bạn phát triển tính năng tích hợp:

Môi trường nguồn cấp dữ liệu Mô tả Truyền dẫn hàng loạt
Hộp cát Môi trường thử nghiệm để phát triển nguồn cấp dữ liệu. Bắt buộc
Sản xuất Môi trường phát hành chính thức cho khoảng không quảng cáo mà bạn muốn ra mắt. Bắt buộc

Lưu trữ nguồn cấp dữ liệu

Để tính năng Đặt hàng toàn diện xử lý nguồn cấp dữ liệu Sandbox và nguồn cấp dữ liệu Sản xuất theo lô, bạn phải lưu trữ các tệp nguồn cấp dữ liệu trong Google Cloud Storage, Amazon S3 hoặc HTTPS bằng một bản đồ trang web.

Bạn nên lưu trữ nguồn cấp dữ liệu cho môi trường hộp cát và môi trường phát hành chính thức riêng biệt. Phương pháp này cho phép bạn phát triển và kiểm thử trong môi trường nguồn cấp dữ liệu hộp cát trước khi triển khai các thay đổi cho môi trường thực tế.

Ví dụ: nếu sử dụng Google Cloud Storage làm lựa chọn lưu trữ, bạn sẽ có các đường dẫn sau:

  • Nguồn cấp dữ liệu hộp cát: gs://foorestaurant-google-feed-sandbox/
  • Nguồn cấp dữ liệu chính thức: gs://foorestaurant-google-feed-prod/

Để lưu trữ khoảng không quảng cáo, hãy làm như sau:

  1. Tạo tệp nguồn cấp dữ liệu.
  2. Chọn một giải pháp lưu trữ.
  3. Lưu trữ nguồn cấp dữ liệu.
  4. Đảm bảo rằng bạn thường xuyên cập nhật tệp nguồn cấp dữ liệu. Bạn phải cập nhật nguồn cấp dữ liệu chính thức hằng ngày.

Để biết thông tin chi tiết về cách tạo nguồn cấp dữ liệu kho hàng, hãy xem tài liệu về các thực thể Restaurant, ServiceMenu, cũng như phần Tạo nguồn cấp dữ liệu.

Nguyên tắc về tệp nguồn cấp dữ liệu

Mỗi tệp (có thể chứa nhiều thực thể) không được vượt quá 200 MB. Tổng dung lượng của các thực thể cấp cao nhất Restaurant, ServiceMenu cùng với các thực thể con của chúng không được vượt quá 4 MB.

Chọn giải pháp lưu trữ

Bảng sau đây liệt kê các tuỳ chọn lưu trữ nguồn cấp dữ liệu và cách các máy chủ lưu trữ đó hoạt động với tính năng Đặt hàng toàn diện:

Amazon S3 Google Cloud Storage HTTPS có sơ đồ trang web
Thông tin xác thực và quyền truy cập

Cung cấp cho Google những thông tin sau:

  • Mã khoá truy cập
  • Khoá truy cập bí mật
  • Đường dẫn đến thư mục S3 và tệp marker.txt của môi trường phát hành công khai và hộp cát. Đường dẫn phải bắt đầu bằng s3://.

Bạn cần cung cấp những thông tin sau cho bộ chứa S3:

  • Tệp nguồn cấp dữ liệu cho khoảng không quảng cáo.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Tệp marker.txt mẫu: 2018-12-03T08:30:42.694Z

Cung cấp cho Google đường dẫn đến thư mục vùng chứa sản xuất và hộp cát cũng như tệp marker.txt. Đường dẫn phải bắt đầu bằng gs://.

Thêm tài khoản dịch vụ do chuyên gia tư vấn của Google cung cấp làm trình đọc của bộ chứa Google Cloud Storage.

Để biết thêm thông tin về cách kiểm soát quyền truy cập vào Google Cloud Storage (GCS), hãy xem bài viết Bảng điều khiển Google Cloud Platform: Đặt quyền cho bộ chứa.

Bạn cần cung cấp các thông tin sau cho bộ chứa GCS:

  • Tệp nguồn cấp dữ liệu cho khoảng không quảng cáo.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Tệp marker.txt mẫu: 2018-12-03T08:30:42.694Z

Cung cấp cho Google những thông tin sau:

  • Thông tin xác thực cho phương thức xác thực cơ bản của bạn.
  • Đường dẫn đến sơ đồ trang web của môi trường phát hành công khai và hộp cát. Đường dẫn phải bắt đầu bằng https://.
  • Giao thức: Bạn phải cung cấp tệp nguồn cấp dữ liệu thông qua HTTPS, chứ không phải HTTP.
  • Bảo mật: Bạn nên bảo vệ các tệp nguồn cấp dữ liệu được lưu trữ bằng tính năng Xác thực cơ bản.
Cách Google biết cần tìm nạp tệp nào Danh sách thư mục của tất cả tệp trong bộ chứa. Danh sách thư mục của tất cả tệp trong bộ chứa. URL riêng lẻ của các tệp được liệt kê trong sơ đồ trang web.
Cách Google biết rằng các tệp đã sẵn sàng để tìm nạp Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt bằng dấu thời gian mới nhất. Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt bằng dấu thời gian mới nhất. Sau khi bạn hoàn tất việc tạo nguồn cấp dữ liệu, hãy cập nhật tiêu đề phản hồi last-modified của sitemap.xml bằng dấu thời gian mới nhất.
Giới hạn về tệp

Số lượng tệp tối đa: 100.000.

Bạn phải có tổng cộng ít hơn 100.000 tệp trong bộ chứa Amazon S3.

Số lượng tệp tối đa: 100.000.

Tổng số tệp trong bộ chứa Google Cloud Storage của bạn phải dưới 100.000 tệp.

Số lượng tệp tối đa: 100.000.

Số lượng đường dẫn tệp trong tệp XML của sơ đồ trang web phải ít hơn 100.000.

Kết nối nguồn cấp dữ liệu để nhập hàng loạt

Sau khi lưu trữ nguồn cấp dữ liệu, bạn cần kết nối các nguồn cấp dữ liệu đó với dự án của mình trên Trung tâm hành động. Bạn có thể định cấu hình ban đầu nguồn cấp dữ liệu chính thức trên trang Nhiệm vụ làm quen. Sau đó, bất kỳ người dùng cổng thông tin nào có vai trò quản trị đều có thể cập nhật cấu hình nguồn cấp dữ liệu phát hành công khai và hộp cát trên trang Cấu hình > Nguồn cấp dữ liệu bất cứ lúc nào. Môi trường hộp cát được dùng cho mục đích phát triển và kiểm thử, còn nguồn cấp dữ liệu chính thức sẽ hiển thị cho người dùng.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Amazon S3

  1. Trong Trung tâm hành động, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền thông tin vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Phương thức phân phối nguồn cấp dữ liệu: Đặt thành Amazon S3.
    • Tệp điểm đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL đến bộ chứa S3 chứa nguồn cấp dữ liệu.
    • Mã truy cập: Nhập mã khoá truy cập IAM có quyền đọc từ các tài nguyên S3.
    • Khoá truy cập: Nhập khoá truy cập bí mật của IAM có quyền đọc từ các tài nguyên S3.
  3. Nhấp vào Gửi.
  4. Sau 1 đến 2 giờ, hãy kiểm tra xem tính năng truyền dẫn hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Google Cloud Storage

  1. Trong Trung tâm hành động, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền thông tin vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Phương thức phân phối nguồn cấp dữ liệu: Đặt thành Google Cloud Storage.
    • Tệp điểm đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL đến bộ chứa GCS chứa nguồn cấp dữ liệu.
  3. Nhấp vào Gửi.
  4. Một tài khoản dịch vụ sẽ được tạo để truy cập vào bộ chứa GCS của bạn. Bạn có thể tìm thấy tên tài khoản trong phần Cấu hình > Nguồn cấp dữ liệu sau khi hoàn tất các nhiệm vụ làm quen. Tài khoản dịch vụ này cần có vai trò "Người đọc đối tượng cũ của bộ nhớ". Bạn có thể cấp vai trò này cho tài khoản dịch vụ trong trang IAM của Bảng điều khiển Google Cloud.
  5. Sau 1 đến 2 giờ, hãy kiểm tra xem tính năng truyền dẫn hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng HTTPS

  1. Trong Trung tâm hành động, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền thông tin vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Phương thức phân phối nguồn cấp dữ liệu: Đặt thành HTTPS.
    • Tệp sơ đồ trang web: Cung cấp URL của tệp sitemap.xml.
    • Tên người dùng: Nhập thông tin đăng nhập tên người dùng để truy cập vào máy chủ HTTPS.
    • Mật khẩu: Nhập mật khẩu để truy cập vào máy chủ HTTPS.
  3. Nhấp vào Gửi.
  4. Sau 1 đến 2 giờ, hãy kiểm tra xem tính năng truyền dẫn hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Ví dụ về đường dẫn

Bảng sau đây chứa các đường dẫn mẫu cho từng tuỳ chọn lưu trữ:

Amazon S3 Google Cloud Storage HTTPS có sơ đồ trang web
Đường dẫn s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
Tệp điểm đánh dấu s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Không áp dụng

Sơ đồ trang web cho dịch vụ lưu trữ HTTPS

Hãy làm theo các nguyên tắc sau đây khi xác định sơ đồ trang web:

  • Đường liên kết trong sơ đồ trang web phải trỏ đến chính các tệp đó.
  • Nếu sơ đồ trang web của bạn có tham chiếu đến một nhà cung cấp dịch vụ đám mây thay vì tên miền của riêng bạn, hãy đảm bảo rằng phần đầu của URL, chẳng hạn như https://www.yourcloudprovider.com/your_id, phải ổn định và duy nhất cho công việc hàng loạt của bạn.
  • Hãy cẩn thận để không tải một phần sơ đồ trang web lên (chẳng hạn như trong trường hợp tải một phần dữ liệu lên). Việc này sẽ khiến Google chỉ nhập các tệp trong sơ đồ trang web, khiến mức tồn kho của bạn giảm và có thể khiến quá trình nhập nguồn cấp dữ liệu bị chặn.
  • Đảm bảo rằng đường dẫn đến các tệp được tham chiếu trong sơ đồ trang web không thay đổi. Ví dụ: đừng để sơ đồ trang web tham chiếu đến https://www.yourcloudprovider.com/your_id/10000.json hôm nay rồi tham chiếu đến https://www.yourcloudprovider.com/your_id/20000.json vào ngày mai.
Sơ đồ trang web minh hoạ

Dưới đây là tệp sitemap.xml mẫu phân phát tệp nguồn cấp dữ liệu:

Ví dụ 1: Các thực thể được nhóm theo người bán (Nên dùng).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Ví dụ 2: Các thực thể được nhóm theo loại.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Cập nhật nguồn cấp dữ liệu

Sau khi kết nối nguồn cấp dữ liệu, Google sẽ kiểm tra nội dung cập nhật một lần mỗi giờ, nhưng chúng tôi chỉ nhập tất cả nguồn cấp dữ liệu khi tệp marker.txt hoặc sitemap.xml đã được sửa đổi. Bạn nên cập nhật nguồn cấp dữ liệu một lần mỗi ngày để tránh tình trạng kho hàng lỗi thời.

Để chỉ định rằng nguồn cấp dữ liệu đã được sửa đổi và sẵn sàng để nhập hàng loạt, hãy cập nhật trường siêu dữ liệu đối tượng last-modified của tệp marker.txt (Đối với GCP và S3) hoặc tiêu đề phản hồi last-modified của tệp sitemap.xml. Google sử dụng các giá trị này để xác định mức độ mới của nguồn cấp dữ liệu.

Khi nguồn cấp dữ liệu theo lô đang được nhập,

  • Các thực thể mới không tồn tại trong khoảng không quảng cáo Đặt hàng toàn diện hiện tại và không có lỗi sẽ được chèn.
  • Những thực thể đã có trong khoảng không quảng cáo và không gặp lỗi nào khi nhập, đồng thời có dateModified mới hơn mục nhập hiện tại hoặc trong trường hợp không có dateModified, thời gian bắt đầu nhập nguồn cấp dữ liệu mới hơn mục nhập hiện tại, thì các thực thể đó sẽ được cập nhật, nếu không, chúng sẽ bị đánh dấu là cũ.
  • Các thực thể thuộc nguồn cấp dữ liệu trước đó không còn có trong nguồn cấp dữ liệu theo lô đang được xử lý sẽ bị xoá, miễn là không có lỗi cấp tệp trong nguồn cấp dữ liệu.

Bạn chỉ được cập nhật dấu thời gian hoặc tiêu đề phản hồi last-modified sau khi tất cả tệp nguồn cấp dữ liệu được tạo và cập nhật. Giới hạn các công việc hàng loạt cập nhật nguồn cấp dữ liệu của bạn chỉ chạy một lần mỗi ngày. Ngoài ra, hãy để khoảng thời gian ít nhất 3 giờ giữa mỗi công việc theo lô. Nếu bạn không thực hiện các bước này, Google có thể tìm nạp các tệp cũ.