Nhập theo lô

Nguồn cấp dữ liệu cho phép bạn cung cấp nhà hàng, dịch vụ và thực đơn trong tính năng Đặt món bằng Google.

Tài liệu này trình bày cách lưu trữ hộp cát và tính năng sản xuất của bạn. Bạn cũng có thể sử dụng tính năng nhập theo nhóm để cập nhật quỹ phòng trong tính năng Đặt món bằng Google.

Môi trường nguồn cấp dữ liệu

Có ba môi trường nguồn cấp dữ liệu để bạn phát triển việc tích hợp:

Môi trường nguồn cấp dữ liệu Mô tả Nhập theo lô
Hộp cát Môi trường thử nghiệm để phát triển nguồn cấp dữ liệu. Bắt buộc
Sản xuất Môi trường sản xuất cho khoảng không quảng cáo mà bạn muốn khởi chạy. Bắt buộc

Lưu trữ nguồn cấp dữ liệu

Để Đặt món bằng Google xử lý nguồn cấp dữ liệu Hộp cát và dữ liệu sản xuất của bạn bằng phương thức nhập hàng loạt, bạn phải lưu trữ các tệp nguồn cấp dữ liệu của mình trong Google Cloud Storage, Amazon S3 hoặc HTTPS bằng sơ đồ trang web.

Bạn nên lưu trữ riêng các nguồn cấp dữ liệu cho môi trường hộp cát và môi trường sản xuất của mình. Phương pháp này cho phép bạn phát triển và thử nghiệm trong môi trường nguồn cấp dữ liệu hộp cát trước khi triển khai các thay đổi trong quá trình sản xuất.

Ví dụ: nếu sử dụng Google Cloud Storage làm tùy chọn lưu trữ, bạn sẽ có các đường dẫn sau:

  • Nguồn cấp dữ liệu Sandbox: gs://foorestaurant-google-feed-sandbox/
  • Nguồn cấp dữ liệu sản xuất: gs://foorestaurant-google-feed-prod/

Để lưu trữ khoảng không quảng cáo, hãy làm như sau:

  1. Tạo các tệp nguồn cấp dữ liệu.
  2. Chọn một giải pháp lưu trữ.
  3. Lưu trữ nguồn cấp dữ liệu của bạn.
  4. Hãy đảm bảo rằng bạn thường xuyên cập nhật các tệp nguồn cấp dữ liệu. Nguồn cấp dữ liệu sản xuất phải được cập nhật hằng ngày.

Để biết thông tin chi tiết về cách tạo nguồn cấp dữ liệu kho hàng, hãy xem tài liệu về các thực thể Restaurant, ServiceMenu, cũng như mục Tạo nguồn cấp dữ liệu.

Nguyên tắc đối với tệp nguồn cấp dữ liệu

Mỗi tệp (có thể chứa nhiều thực thể) không được vượt quá 200 MB. Các thực thể cấp cao nhất Restaurant, ServiceMenu, cùng với các thực thể con của chúng, không được vượt quá 4 MB cùng nhau.

Chọn một giải pháp lưu trữ

Bảng sau đây liệt kê các tùy chọn để lưu trữ nguồn cấp dữ liệu của bạn và cách các máy chủ đó hoạt động với tính năng Đặt món bằng Google:

Amazon S3 Google Cloud Storage HTTPS có sơ đồ trang web
Thông tin xác thực và quyền truy cập

Cung cấp cho Google những thông tin sau:

  • Mã khoá truy cập
  • Khoá truy cập bí mật
  • Đường dẫn đến thư mục S3 hộp cát và sản xuất cũng như tệp marker.txt. Đường dẫn phải bắt đầu bằng s3://.

Bộ chứa S3 cần bao gồm các thông tin sau:

  • Các tệp nguồn cấp dữ liệu cho kho hàng của bạn.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Ví dụ về tệp marker.txt: 2018-12-03T08:30:42.694Z

Cung cấp cho Google các đường dẫn đến thư mục nhóm sản xuất và hộp cát cũng như tệp marker.txt. Đường dẫn phải bắt đầu bằng gs://.

Thêm tài khoản dịch vụ do chuyên gia tư vấn của Google cung cấp làm người đọc bộ chứa Google Cloud Storage.

Để biết thêm thông tin về cách kiểm soát quyền truy cập vào Google Cloud Storage (GCS), hãy xem phần Google Cloud Platform Console: Đặt quyền bộ chứa.

Bộ chứa GCS cần bao gồm các thông tin sau:

  • Các tệp nguồn cấp dữ liệu cho kho hàng của bạn.
  • marker.txt, chứa dấu thời gian dùng để tìm nạp.

Ví dụ về tệp marker.txt: 2018-12-03T08:30:42.694Z

Cung cấp cho Google những thông tin sau:

  • Thông tin xác thực cho thông tin xác thực cơ bản của bạn.
  • Đường dẫn đến đường dẫn sơ đồ trang web sản xuất và hộp cát của bạn. Đường dẫn phải bắt đầu bằng https://.
  • Giao thức: Bạn phải cung cấp tệp nguồn cấp dữ liệu qua HTTPS, chứ không phải HTTP.
  • Bảo mật: Google đặc biệt khuyến nghị bạn bảo vệ các tệp nguồn cấp dữ liệu được lưu trữ bằng tính năng Xác thực cơ bản.
Cách Google biết cần tìm nạp tệp nào Danh sách thư mục của tất cả các tệp trong bộ chứa. Danh sách thư mục của tất cả các tệp trong bộ chứa. URL riêng lẻ của tệp được liệt kê trong sơ đồ trang web.
Làm thế nào Google biết rằng tệp đã sẵn sàng để tìm nạp Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tệp marker.txt. Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tệp marker.txt. Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tiêu đề phản hồi last-modified của sitemap.xml.
Giới hạn tệp

Số lượng tệp tối đa: 100.000.

Bạn phải có tổng cộng dưới 100.000 tệp trong bộ chứa Amazon S3.

Số lượng tệp tối đa: 100.000.

Bạn phải có dưới 100.000 tệp trong bộ chứa Google Cloud Storage.

Số lượng tệp tối đa: 100.000.

Số lượng đường dẫn tệp trong tệp XML sơ đồ trang web của bạn phải nhỏ hơn 100.000.

Kết nối nguồn cấp dữ liệu để nhập theo lô

Sau khi lưu trữ nguồn cấp dữ liệu, bạn cần kết nối nguồn cấp dữ liệu đó với dự án của mình trên Cổng đối tác. Cấu hình ban đầu của nguồn cấp dữ liệu chính thức được thực hiện trên trang Nhiệm vụ tham gia. Sau đó, bạn có thể cập nhật cấu hình nguồn cấp dữ liệu sản xuất và sandbox từ trang Cấu hình > Nguồn cấp dữ liệu bất cứ lúc nào bởi người dùng cổng có vai trò quản trị. Môi trường hộp cát được dùng cho mục đích phát triển và thử nghiệm, còn nguồn cấp dữ liệu chính thức thì hiển thị cho người dùng.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Amazon S3

  1. Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Cách phân phối nguồn cấp dữ liệu: Đặt thành Amazon S3.
    • Tệp đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL vào nhóm S3 chứa nguồn cấp dữ liệu.
    • Mã truy cập: Nhập mã khoá truy cập IAM có quyền đọc từ tài nguyên S3.
    • Khoá truy cập: Nhập khoá truy cập bí mật IAM có quyền đọc từ tài nguyên S3.
  3. Nhấp vào Gửi.
  4. Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Google Cloud Storage

  1. Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Cách phân phối nguồn cấp dữ liệu: Đặt thành Google Cloud Storage.
    • Tệp đánh dấu: Cung cấp URL của tệp marker.txt.
    • Tệp dữ liệu: Cung cấp URL tới bộ chứa GCS chứa nguồn cấp dữ liệu.
  3. Nhấp vào Gửi.
  4. Một tài khoản dịch vụ được tạo để truy cập vào bộ chứa GCS của bạn. Bạn có thể tìm thấy tên tài khoản trong phần Cấu hình > Nguồn cấp dữ liệu sau khi hoàn thành các nhiệm vụ trong quy trình giới thiệu. Tài khoản dịch vụ này cần có vai trò "Trình đọc đối tượng cũ trong bộ nhớ". Vai trò này có thể được cấp cho tài khoản dịch vụ trên trang IAM của Google Cloud Console.
  5. Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Nếu bạn lưu trữ nguồn cấp dữ liệu bằng HTTPS

  1. Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
  2. Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:

    • Cách phân phối nguồn cấp dữ liệu: Đặt thành HTTPS.
    • Tệp sơ đồ trang web: Cung cấp URL của tệp sitemap.xml.
    • Tên người dùng: Nhập thông tin xác thực tên người dùng để truy cập vào máy chủ HTTPS.
    • Mật khẩu: Nhập mật khẩu để truy cập vào máy chủ HTTPS.
  3. Nhấp vào Gửi.
  4. Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.

Đường dẫn mẫu

Bảng sau đây trình bày các đường dẫn mẫu cho từng lựa chọn lưu trữ:

Amazon S3 Google Cloud Storage HTTPS có sơ đồ trang web
Đường dẫn s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
Tệp đánh dấu s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Không áp dụng

Sơ đồ trang web để lưu trữ HTTPS

Hãy áp dụng các nguyên tắc sau khi xác định sơ đồ trang web:

  • Các đường liên kết trong sơ đồ trang web của bạn phải trỏ đến chính các tệp đó.
  • Nếu sơ đồ trang web của bạn có chứa thông tin tham chiếu đến nhà cung cấp dịch vụ đám mây thay vì tên miền của riêng bạn, hãy đảm bảo rằng phần đầu của các URL như https://www.yourcloudprovider.com/your_id, một cách ổn định và riêng biệt cho công việc hàng loạt của bạn.
  • Hãy cẩn thận để tránh tải lên một phần sơ đồ trang web (ví dụ như trong trường hợp tải một phần dữ liệu lên). Làm như vậy sẽ khiến Google chỉ nhập các tệp trong sơ đồ trang web. Việc này sẽ khiến mức khoảng không quảng cáo của bạn giảm và có thể dẫn đến việc nguồn cấp dữ liệu của bạn bị chặn.
  • Hãy đảm bảo rằng đường dẫn đến tệp tham chiếu trong sơ đồ trang web không thay đổi. Ví dụ: đừng dùng tệp tham chiếu cho sơ đồ trang web https://www.yourcloudprovider.com/your_id/10000.json hôm nay mà hãy tham chiếu đến https://www.yourcloudprovider.com/your_id/20000.json vào ngày mai.
Sơ đồ trang web minh hoạ

Dưới đây là ví dụ về một tệp sitemap.xml phân phát các tệp nguồn cấp dữ liệu:

Ví dụ 1: Các thực thể được nhóm theo người bán (Nên dùng).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Ví dụ 2: Các thực thể được nhóm theo loại.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Cập nhật nguồn cấp dữ liệu

Sau khi nguồn cấp dữ liệu được kết nối, Google sẽ kiểm tra bản cập nhật mỗi giờ một lần. Tuy nhiên, chúng tôi chỉ nhập tất cả nguồn cấp dữ liệu khi tệp marker.txt hoặc sitemap.xml đã được sửa đổi. Chúng tôi hy vọng bạn sẽ cập nhật nguồn cấp dữ liệu mỗi ngày một lần để tránh tình trạng khoảng không quảng cáo cũ.

Để chỉ định rằng nguồn cấp dữ liệu đã được sửa đổi và sẵn sàng cho việc nhập hàng loạt, hãy cập nhật trường siêu dữ liệu đối tượng last-modified của tệp marker.txt (Đối với GCP và S3) hoặc tiêu đề phản hồi last-modified của tệp sitemap.xml. Google sử dụng các giá trị này để xác định độ mới của nguồn cấp dữ liệu.

Khi nhập nguồn cấp dữ liệu hàng loạt,

  • Các thực thể mới không tồn tại trong kho hàng OwG hiện tại và không có lỗi nào sẽ được chèn vào.
  • Các thực thể đã có mặt trong khoảng không quảng cáo không có lỗi nào khi nhập và có dateModified gần đây hơn so với mục hiện tại hoặc trong trường hợp không có dateModified, thì thời gian bắt đầu nhập nguồn cấp dữ liệu gần đây hơn so với mục hiện tại mà chúng sẽ được cập nhật. Nếu không, các thực thể đó sẽ bị đánh dấu là lỗi thời.
  • Các thực thể từng là một nguồn cấp dữ liệu trước đó không còn được đưa vào nguồn cấp dữ liệu hàng loạt đang được xử lý sẽ bị xóa, miễn là không có lỗi ở cấp độ tệp trong nguồn cấp dữ liệu.

Bạn chỉ được cập nhật dấu thời gian hoặc tiêu đề phản hồi last-modified sau khi tạo và cập nhật tất cả tệp nguồn cấp dữ liệu. Giới hạn các công việc hàng loạt cập nhật nguồn cấp dữ liệu của bạn để chỉ chạy một lần mỗi ngày. Ngoài ra, khoảng cách giữa mỗi công việc trong mỗi lô ít nhất là 3 giờ. Nếu bạn không thực hiện các bước này, thì Google có thể tìm nạp các tệp cũ.