Nguồn cấp dữ liệu cho phép bạn cung cấp nhà hàng, dịch vụ và thực đơn trong tính năng Đặt món bằng Google.
Tài liệu này trình bày cách lưu trữ hộp cát và tính năng sản xuất của bạn. Bạn cũng có thể sử dụng tính năng nhập theo nhóm để cập nhật quỹ phòng trong tính năng Đặt món bằng Google.
Môi trường nguồn cấp dữ liệu
Có ba môi trường nguồn cấp dữ liệu để bạn phát triển việc tích hợp:
Môi trường nguồn cấp dữ liệu | Mô tả | Nhập theo lô |
---|---|---|
Hộp cát | Môi trường thử nghiệm để phát triển nguồn cấp dữ liệu. | Bắt buộc |
Sản xuất | Môi trường sản xuất cho khoảng không quảng cáo mà bạn muốn khởi chạy. | Bắt buộc |
Lưu trữ nguồn cấp dữ liệu
Để Đặt món bằng Google xử lý nguồn cấp dữ liệu Hộp cát và dữ liệu sản xuất của bạn bằng phương thức nhập hàng loạt, bạn phải lưu trữ các tệp nguồn cấp dữ liệu của mình trong Google Cloud Storage, Amazon S3 hoặc HTTPS bằng sơ đồ trang web.
Bạn nên lưu trữ riêng các nguồn cấp dữ liệu cho môi trường hộp cát và môi trường sản xuất của mình. Phương pháp này cho phép bạn phát triển và thử nghiệm trong môi trường nguồn cấp dữ liệu hộp cát trước khi triển khai các thay đổi trong quá trình sản xuất.
Ví dụ: nếu sử dụng Google Cloud Storage làm tùy chọn lưu trữ, bạn sẽ có các đường dẫn sau:
- Nguồn cấp dữ liệu Sandbox:
gs://foorestaurant-google-feed-sandbox/
- Nguồn cấp dữ liệu sản xuất:
gs://foorestaurant-google-feed-prod/
Để lưu trữ khoảng không quảng cáo, hãy làm như sau:
- Tạo các tệp nguồn cấp dữ liệu.
- Chọn một giải pháp lưu trữ.
- Lưu trữ nguồn cấp dữ liệu của bạn.
- Hãy đảm bảo rằng bạn thường xuyên cập nhật các tệp nguồn cấp dữ liệu. Nguồn cấp dữ liệu sản xuất phải được cập nhật hằng ngày.
Để biết thông tin chi tiết về cách tạo nguồn cấp dữ liệu kho hàng, hãy xem tài liệu về các thực thể Restaurant
, Service
và Menu
, cũng như mục Tạo nguồn cấp dữ liệu.
Nguyên tắc đối với tệp nguồn cấp dữ liệu
Mỗi tệp (có thể chứa nhiều thực thể) không được vượt quá 200 MB. Các thực thể cấp cao nhất Restaurant
, Service
và Menu
, cùng với các thực thể con của chúng, không được vượt quá 4 MB cùng nhau.
Chọn một giải pháp lưu trữ
Bảng sau đây liệt kê các tùy chọn để lưu trữ nguồn cấp dữ liệu của bạn và cách các máy chủ đó hoạt động với tính năng Đặt món bằng Google:
Amazon S3 | Google Cloud Storage | HTTPS có sơ đồ trang web | |
---|---|---|---|
Thông tin xác thực và quyền truy cập |
Cung cấp cho Google những thông tin sau:
Bộ chứa S3 cần bao gồm các thông tin sau:
Ví dụ về tệp |
Cung cấp cho Google các đường dẫn đến thư mục nhóm sản xuất và hộp cát cũng như
tệp Thêm tài khoản dịch vụ do chuyên gia tư vấn của Google cung cấp làm người đọc bộ chứa Google Cloud Storage. Để biết thêm thông tin về cách kiểm soát quyền truy cập vào Google Cloud Storage (GCS), hãy xem phần Google Cloud Platform Console: Đặt quyền bộ chứa. Bộ chứa GCS cần bao gồm các thông tin sau:
Ví dụ về tệp |
Cung cấp cho Google những thông tin sau:
|
Cách Google biết cần tìm nạp tệp nào | Danh sách thư mục của tất cả các tệp trong bộ chứa. | Danh sách thư mục của tất cả các tệp trong bộ chứa. | URL riêng lẻ của tệp được liệt kê trong sơ đồ trang web. |
Làm thế nào Google biết rằng tệp đã sẵn sàng để tìm nạp | Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tệp marker.txt . |
Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tệp marker.txt . |
Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật dấu thời gian mới nhất trong tiêu đề phản hồi
last-modified của sitemap.xml . |
Giới hạn tệp |
Số lượng tệp tối đa: 100.000. Bạn phải có tổng cộng dưới 100.000 tệp trong bộ chứa Amazon S3. |
Số lượng tệp tối đa: 100.000. Bạn phải có dưới 100.000 tệp trong bộ chứa Google Cloud Storage. |
Số lượng tệp tối đa: 100.000. Số lượng đường dẫn tệp trong tệp XML sơ đồ trang web của bạn phải nhỏ hơn 100.000. |
Kết nối nguồn cấp dữ liệu để nhập theo lô
Sau khi lưu trữ nguồn cấp dữ liệu, bạn cần kết nối nguồn cấp dữ liệu đó với dự án của mình trên Cổng đối tác. Cấu hình ban đầu của nguồn cấp dữ liệu chính thức được thực hiện trên trang Nhiệm vụ tham gia. Sau đó, bạn có thể cập nhật cấu hình nguồn cấp dữ liệu sản xuất và sandbox từ trang Cấu hình > Nguồn cấp dữ liệu bất cứ lúc nào bởi người dùng cổng có vai trò quản trị. Môi trường hộp cát được dùng cho mục đích phát triển và thử nghiệm, còn nguồn cấp dữ liệu chính thức thì hiển thị cho người dùng.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Amazon S3
- Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Cách phân phối nguồn cấp dữ liệu: Đặt thành Amazon S3.
- Tệp đánh dấu: Cung cấp URL của tệp
marker.txt
. - Tệp dữ liệu: Cung cấp URL vào nhóm S3 chứa nguồn cấp dữ liệu.
- Mã truy cập: Nhập mã khoá truy cập IAM có quyền đọc từ tài nguyên S3.
- Khoá truy cập: Nhập khoá truy cập bí mật IAM có quyền đọc từ tài nguyên S3.
- Nhấp vào Gửi.
- Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Google Cloud Storage
- Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Cách phân phối nguồn cấp dữ liệu: Đặt thành Google Cloud Storage.
- Tệp đánh dấu: Cung cấp URL của tệp
marker.txt
. - Tệp dữ liệu: Cung cấp URL tới bộ chứa GCS chứa nguồn cấp dữ liệu.
- Nhấp vào Gửi.
- Một tài khoản dịch vụ được tạo để truy cập vào bộ chứa GCS của bạn. Bạn có thể tìm thấy tên tài khoản trong phần Cấu hình > Nguồn cấp dữ liệu sau khi hoàn thành các nhiệm vụ trong quy trình giới thiệu. Tài khoản dịch vụ này cần có vai trò "Trình đọc đối tượng cũ trong bộ nhớ". Vai trò này có thể được cấp cho tài khoản dịch vụ trên trang IAM của Google Cloud Console.
- Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng HTTPS
- Trong Cổng đối tác, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa và điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Cách phân phối nguồn cấp dữ liệu: Đặt thành HTTPS.
- Tệp sơ đồ trang web: Cung cấp URL của tệp
sitemap.xml
. - Tên người dùng: Nhập thông tin xác thực tên người dùng để truy cập vào máy chủ HTTPS.
- Mật khẩu: Nhập mật khẩu để truy cập vào máy chủ HTTPS.
- Nhấp vào Gửi.
- Sau một đến hai giờ, hãy kiểm tra xem tính năng nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Đường dẫn mẫu
Bảng sau đây trình bày các đường dẫn mẫu cho từng lựa chọn lưu trữ:
Amazon S3 | Google Cloud Storage | HTTPS có sơ đồ trang web | |
---|---|---|---|
Đường dẫn | s3://foorestaurant-google-feed-sandbox/ |
gs://foorestaurant-google-feed-sandbox/ |
https://sandbox-foorestaurant.com/sitemap.xml |
Tệp đánh dấu | s3://foorestaurant-google-feed-sandbox/marker.txt |
gs://foorestaurant-google-feed-sandbox/marker.txt |
Không áp dụng |
Sơ đồ trang web để lưu trữ HTTPS
Hãy áp dụng các nguyên tắc sau khi xác định sơ đồ trang web:
- Các đường liên kết trong sơ đồ trang web của bạn phải trỏ đến chính các tệp đó.
- Nếu sơ đồ trang web của bạn có chứa thông tin tham chiếu đến nhà cung cấp dịch vụ đám mây thay vì tên miền của riêng bạn, hãy đảm bảo rằng phần đầu của các URL như
https://www.yourcloudprovider.com/your_id
, một cách ổn định và riêng biệt cho công việc hàng loạt của bạn. - Hãy cẩn thận để tránh tải lên một phần sơ đồ trang web (ví dụ như trong trường hợp tải một phần dữ liệu lên). Làm như vậy sẽ khiến Google chỉ nhập các tệp trong sơ đồ trang web. Việc này sẽ khiến mức khoảng không quảng cáo của bạn giảm và có thể dẫn đến việc nguồn cấp dữ liệu của bạn bị chặn.
- Hãy đảm bảo rằng đường dẫn đến tệp tham chiếu trong sơ đồ trang web không thay đổi. Ví dụ: đừng dùng tệp tham chiếu cho sơ đồ trang web
https://www.yourcloudprovider.com/your_id/10000.json
hôm nay mà hãy tham chiếu đếnhttps://www.yourcloudprovider.com/your_id/20000.json
vào ngày mai.
Sơ đồ trang web minh hoạ
Dưới đây là ví dụ về một tệp sitemap.xml
phân phát các tệp nguồn cấp dữ liệu:
Ví dụ 1: Các thực thể được nhóm theo người bán (Nên dùng).
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Ví dụ 2: Các thực thể được nhóm theo loại.
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/menu.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/service.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Cập nhật nguồn cấp dữ liệu
Sau khi nguồn cấp dữ liệu được kết nối, Google sẽ kiểm tra bản cập nhật mỗi giờ một lần. Tuy nhiên, chúng tôi chỉ nhập tất cả nguồn cấp dữ liệu khi tệp marker.txt
hoặc sitemap.xml
đã được sửa đổi. Chúng tôi hy vọng bạn sẽ cập nhật nguồn cấp dữ liệu mỗi ngày một lần để tránh tình trạng khoảng không quảng cáo cũ.
Để chỉ định rằng nguồn cấp dữ liệu đã được sửa đổi và sẵn sàng cho việc nhập hàng loạt, hãy cập nhật trường siêu dữ liệu đối tượng last-modified
của tệp marker.txt
(Đối với GCP và S3) hoặc tiêu đề phản hồi last-modified
của tệp sitemap.xml
. Google sử dụng các giá trị này để xác định độ mới của nguồn cấp dữ liệu.
Khi nhập nguồn cấp dữ liệu hàng loạt,
- Các thực thể mới không tồn tại trong kho hàng OwG hiện tại và không có lỗi nào sẽ được chèn vào.
-
Các thực thể đã có mặt trong khoảng không quảng cáo không có lỗi nào khi nhập và có
dateModified
gần đây hơn so với mục hiện tại hoặc trong trường hợp không códateModified
, thì thời gian bắt đầu nhập nguồn cấp dữ liệu gần đây hơn so với mục hiện tại mà chúng sẽ được cập nhật. Nếu không, các thực thể đó sẽ bị đánh dấu là lỗi thời. - Các thực thể từng là một nguồn cấp dữ liệu trước đó không còn được đưa vào nguồn cấp dữ liệu hàng loạt đang được xử lý sẽ bị xóa, miễn là không có lỗi ở cấp độ tệp trong nguồn cấp dữ liệu.
Bạn chỉ được cập nhật dấu thời gian hoặc tiêu đề phản hồi last-modified
sau khi tạo và cập nhật tất cả tệp nguồn cấp dữ liệu. Giới hạn các công việc hàng loạt cập nhật nguồn cấp dữ liệu của bạn để chỉ chạy một lần mỗi ngày. Ngoài ra, khoảng cách giữa mỗi công việc trong mỗi lô ít nhất là 3 giờ. Nếu bạn không thực hiện các bước này, thì Google có thể tìm nạp các tệp cũ.