Nhập hàng loạt

Nguồn cấp dữ liệu của bạn cho phép bạn cung cấp nhà hàng, dịch vụ và thực đơn của mình trong Đặt hàng hoàn chỉnh.

Tài liệu này trình bày cách lưu trữ khoảng không quảng cáo chính thức và hộp cát, cũng như cách sử dụng quy trình nhập hàng loạt để cập nhật kho hàng trong quy trình Đặt hàng hoàn chỉnh.

Môi trường nguồn cấp dữ liệu

Hiện có ba môi trường nguồn cấp dữ liệu để bạn phát triển tính năng tích hợp:

Môi trường của nguồn cấp dữ liệu Mô tả Nhập hàng loạt
Hộp cát Môi trường thử nghiệm quá trình phát triển nguồn cấp dữ liệu. Bắt buộc
Sản xuất Môi trường sản xuất cho khoảng không quảng cáo bạn muốn khởi chạy. Bắt buộc

Lưu trữ nguồn cấp dữ liệu

Để có thể đặt hàng hoàn chỉnh, bạn có thể xử lý nguồn cấp dữ liệu của Hộp cát và Sản phẩm theo lô nhập dữ liệu, bạn phải lưu trữ các tệp nguồn cấp dữ liệu của mình trong Google Cloud Storage, Amazon S3 hoặc HTTPS bằng sơ đồ trang web.

Bạn nên lưu trữ nguồn cấp dữ liệu cho môi trường hộp cát và môi trường thực tế riêng biệt. Phương pháp này cho phép bạn phát triển và thử nghiệm trong môi trường nguồn cấp dữ liệu hộp cát của mình trước khi triển khai thay đổi vào phiên bản chính thức.

Ví dụ: nếu sử dụng Google Cloud Storage làm lựa chọn lưu trữ, bạn sẽ có: đường dẫn:

  • Nguồn cấp dữ liệu Hộp cát: gs://foorestaurant-google-feed-sandbox/
  • Nguồn cấp dữ liệu sản xuất: gs://foorestaurant-google-feed-prod/

Để lưu trữ khoảng không quảng cáo, hãy làm như sau:

  1. Tạo tệp nguồn cấp dữ liệu.
  2. Chọn một giải pháp lưu trữ.
  3. Lưu trữ nguồn cấp dữ liệu của bạn.
  4. Hãy đảm bảo rằng các tệp nguồn cấp dữ liệu của bạn được cập nhật thường xuyên. Bạn phải cập nhật nguồn cấp dữ liệu sản xuất mỗi ngày.

Để biết thông tin chi tiết về cách tạo nguồn cấp dữ liệu kho hàng, hãy xem tài liệu về Restaurant! Service! và Menu các tổ chức, cũng như Tạo nguồn cấp dữ liệu .

Nguyên tắc về tệp nguồn cấp dữ liệu

Mỗi tệp (có thể chứa nhiều thực thể) không được vượt quá 200 MB. Cấp cao nhất các thực thể Restaurant, ServiceMenu, cùng với các thực thể thực thể con không được vượt quá 4 MB.

Chọn một giải pháp lưu trữ

Bảng sau đây liệt kê các lựa chọn lưu trữ nguồn cấp dữ liệu và cách các máy chủ đó hoạt động Đặt hàng hoàn chỉnh:

Amazon S3 Google Cloud Storage HTTPS với sơ đồ trang web
Thông tin xác thực và quyền truy cập

Cung cấp cho Google những thông tin sau:

  • Mã khoá truy cập
  • Khoá truy cập bí mật
  • Đường dẫn đến thư mục S3 môi trường hộp cát và kênh phát hành công khai cũng như marker.txt . Đường dẫn phải bắt đầu bằng s3://.

Bộ chứa S3 cần bao gồm những thông tin sau:

  • Tệp nguồn cấp dữ liệu cho kho hàng của bạn.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Ví dụ về tệp marker.txt: 2018-12-03T08:30:42.694Z

Cung cấp cho Google đường dẫn đến thư mục bộ chứa hộp cát và phiên bản phát hành công khai của bạn, Tệp marker.txt. Đường dẫn phải bắt đầu bằng gs://.

Thêm tài khoản dịch vụ do chuyên gia tư vấn của Google cung cấp làm tài khoản đọc tài khoản Google của bạn Bộ chứa Cloud Storage.

Để biết thêm thông tin về cách kiểm soát quyền truy cập vào Google Cloud Storage (GCS), hãy xem Google Bảng điều khiển Cloud Platform: Đặt quyền truy cập vào bộ chứa.

Bộ chứa GCS cần bao gồm những thông tin sau:

  • Tệp nguồn cấp dữ liệu cho kho hàng của bạn.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Ví dụ về tệp marker.txt: 2018-12-03T08:30:42.694Z

Cung cấp cho Google những thông tin sau:

  • Thông tin xác thực cơ bản của bạn.
  • Đường dẫn đến đường dẫn sơ đồ trang web tạo và hộp cát của bạn. Đường dẫn phải bắt đầu bằng https://.
  • Giao thức: Bạn phải cung cấp các tệp nguồn cấp dữ liệu thông qua HTTPS, chứ không phải HTTP.
  • Bảo mật: Bạn nên bảo vệ các tệp nguồn cấp dữ liệu được lưu trữ bằng Xác thực cơ bản.
Cách Google biết cần tìm nạp tệp nào Danh sách thư mục của tất cả các tệp trong bộ chứa. Danh sách thư mục của tất cả các tệp trong bộ chứa. Các URL riêng lẻ của tệp được liệt kê trong sơ đồ trang web.
Cách Google biết các tệp đã sẵn sàng tìm nạp Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt với dấu thời gian mới nhất. Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt với dấu thời gian mới nhất. Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tiêu đề phản hồi last-modified/sitemap.xml có dấu thời gian mới nhất.
Giới hạn tệp

Số lượng tệp tối đa: 100.000.

Bạn phải có tổng số ít hơn 100.000 tệp trong bộ chứa Amazon S3 của mình.

Số lượng tệp tối đa: 100.000.

Bạn phải có tổng cộng ít hơn 100.000 tệp trong bộ chứa Google Cloud Storage.

Số lượng tệp tối đa: 100.000.

Số lượng đường dẫn tệp trong tệp XML sơ đồ trang web phải ít hơn 100.000.

Kết nối nguồn cấp dữ liệu của bạn để nhập hàng loạt

Sau khi lưu trữ nguồn cấp dữ liệu, bạn cần kết nối chúng với dự án của mình trên Actions Center. Chiến lược phát hành đĩa đơn cấu hình ban đầu của nguồn cấp dữ liệu chính thức được thực hiện trên trang Việc cần làm trong quá trình làm quen. Sau này cấu hình nguồn cấp dữ liệu sản xuất và hộp cát có thể được cập nhật từ trang Cấu hình > Nguồn cấp dữ liệu bất kỳ lúc nào bởi bất kỳ người dùng cổng thông tin nào có vai trò quản trị. Môi trường hộp cát được dùng cho mục đích phát triển và thử nghiệm, trong khi nguồn cấp dữ liệu chính thức được hiển thị cho người dùng.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Amazon S3

  1. Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Phương thức phân phối nguồn cấp dữ liệu: Đặt thành Amazon S3.
    • Tệp đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL cho bộ chứa S3 chứa nguồn cấp dữ liệu.
    • Mã truy cập: Nhập mã khoá truy cập IAM có quyền đọc từ S3 của chúng tôi.
    • Khoá truy cập: Nhập khoá truy cập bí mật IAM có quyền đọc từ S3 của chúng tôi.
  3. Nhấp vào Gửi.
  4. Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Google Cloud Storage

  1. Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Cách phân phối nguồn cấp dữ liệu: Đặt thành Google Cloud Storage.
    • Tệp đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL vào bộ chứa GCS chứa nguồn cấp dữ liệu.
  3. Nhấp vào Gửi.
  4. Một tài khoản dịch vụ được tạo để truy cập vào bộ chứa GCS của bạn. Bạn có thể tìm thấy tên tài khoản này trong Cấu hình > Nguồn cấp dữ liệu sau các nhiệm vụ giới thiệu đều đã hoàn tất. Tài khoản dịch vụ này cần có vai trò "Người đọc đối tượng cũ của bộ nhớ". Vai trò này có thể được cấp cho tài khoản dịch vụ trên trang IAM của bảng điều khiển Google Cloud.
  5. Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng HTTPS

  1. Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Cách phân phối nguồn cấp dữ liệu: Đặt thành HTTPS.
    • Tệp sơ đồ trang web: Cung cấp URL của tệp sitemap.xml.
    • Tên người dùng: Nhập thông tin đăng nhập của tên người dùng để truy cập vào máy chủ HTTPS.
    • Mật khẩu: Nhập mật khẩu để truy cập vào máy chủ HTTPS.
  3. Nhấp vào Gửi.
  4. Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Đường dẫn mẫu

Bảng sau đây chứa các đường dẫn mẫu cho từng lựa chọn lưu trữ:

Amazon S3 Google Cloud Storage HTTPS với sơ đồ trang web
Đường dẫn s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
Tệp đánh dấu s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Không áp dụng

Sơ đồ trang web dành cho việc lưu trữ HTTPS

Hãy làm theo các nguyên tắc sau khi bạn xác định sơ đồ trang web:

  • Các đường liên kết trong sơ đồ trang web của bạn phải trỏ đến chính các tệp đó.
  • Nếu sơ đồ trang web của bạn chứa thông tin tham chiếu đến một nhà cung cấp dịch vụ đám mây thay vì tên miền của riêng bạn, hãy đảm bảo rằng phần đầu của URL, như https://www.yourcloudprovider.com/your_id, đều ổn định và là duy nhất cho công việc hàng loạt của bạn.
  • Hãy cẩn thận để không tải một phần sơ đồ trang web lên (chẳng hạn như trong trường hợp tải một phần dữ liệu lên). Đang thực hiện do đó, dẫn đến việc Google chỉ nhập các tệp trong sơ đồ trang web. Việc này sẽ khiến kho hàng của bạn giảm xuống và có thể khiến quá trình truyền dẫn nguồn cấp dữ liệu của bạn bị chặn.
  • Đảm bảo rằng đường dẫn đến các tệp được tham chiếu trong sơ đồ trang web không thay đổi. Ví dụ: không nên có tham chiếu đến sơ đồ trang web của bạn https://www.yourcloudprovider.com/your_id/10000.json ngay hôm nay, nhưng sau đó hãy tham khảo https://www.yourcloudprovider.com/your_id/20000.json ngày mai.
Sơ đồ trang web minh hoạ

Dưới đây là tệp sitemap.xml mẫu phân phát các tệp nguồn cấp dữ liệu:

Ví dụ 1: Các đối tượng được nhóm theo người bán (Nên dùng).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Ví dụ 2: Các thực thể được nhóm theo loại.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Cập nhật nguồn cấp dữ liệu

Sau khi nguồn cấp dữ liệu của bạn được kết nối, Google sẽ kiểm tra các bản cập nhật mỗi giờ một lần, nhưng chúng tôi chỉ nhập tất cả nguồn cấp dữ liệu khi các tệp marker.txt hoặc sitemap.xml đã được sửa đổi. Chúng tôi cần cập nhật nguồn cấp dữ liệu mỗi ngày một lần để ngăn kho hàng cũ.

Để xác định rằng nguồn cấp dữ liệu đã được sửa đổi và sẵn sàng để nhập hàng loạt, hãy cập nhật Trường siêu dữ liệu đối tượng last-modified của tệp marker.txt (Dành cho GCP và S3) hoặc tiêu đề phản hồi last-modified của tệp sitemap.xml. Điều khoản sử dụng các giá trị này để xác định độ mới của nguồn cấp dữ liệu.

Khi nhập nguồn cấp dữ liệu hàng loạt,

  • Thực thể mới không tồn tại trong khoảng không quảng cáo Đặt hàng hai đầu hiện tại của bạn và không có bất kỳ thực thể nào lỗi sẽ được chèn vào.
  • Thực thể đã có trong kho hàng và chưa có lỗi nào và có dateModified gần đây hơn so với mục nhập hiện tại hoặc trong trường hợp không có dateModified thời gian bắt đầu nhập nguồn cấp dữ liệu gần đây hơn mục nhập hiện tại mà họ được cập nhật, nếu không thì chúng sẽ bị đánh dấu là cũ.
  • Thực thể thuộc một nguồn cấp dữ liệu trước đây nhưng không còn được đưa vào nguồn cấp dữ liệu lô đang được xử lý sẽ bị xoá, miễn là không có tệp nào trong nguồn cấp dữ liệu.

Bạn chỉ phải cập nhật dấu thời gian hoặc tiêu đề phản hồi last-modified sau khi đã thu thập xong dữ liệu các tệp nguồn cấp dữ liệu được tạo và cập nhật. Giới hạn để các công việc theo lô cập nhật nguồn cấp dữ liệu của bạn chỉ chạy một lần/ngày. Ngoài ra, hãy cách nhau ít nhất 3 giờ giữa mỗi công việc hàng loạt. Nếu không hãy thực hiện các bước sau, Google có thể tìm nạp các tệp cũ.