Nguồn cấp dữ liệu của bạn cho phép bạn cung cấp nhà hàng, dịch vụ và thực đơn của mình trong Đặt hàng hoàn chỉnh.
Tài liệu này trình bày cách lưu trữ khoảng không quảng cáo chính thức và hộp cát, cũng như cách sử dụng quy trình nhập hàng loạt để cập nhật kho hàng trong quy trình Đặt hàng hoàn chỉnh.
Môi trường nguồn cấp dữ liệu
Hiện có ba môi trường nguồn cấp dữ liệu để bạn phát triển tính năng tích hợp:
Môi trường của nguồn cấp dữ liệu | Mô tả | Nhập hàng loạt |
---|---|---|
Hộp cát | Môi trường thử nghiệm quá trình phát triển nguồn cấp dữ liệu. | Bắt buộc |
Sản xuất | Môi trường sản xuất cho khoảng không quảng cáo bạn muốn khởi chạy. | Bắt buộc |
Lưu trữ nguồn cấp dữ liệu
Để có thể đặt hàng hoàn chỉnh, bạn có thể xử lý nguồn cấp dữ liệu của Hộp cát và Sản phẩm theo lô nhập dữ liệu, bạn phải lưu trữ các tệp nguồn cấp dữ liệu của mình trong Google Cloud Storage, Amazon S3 hoặc HTTPS bằng sơ đồ trang web.
Bạn nên lưu trữ nguồn cấp dữ liệu cho môi trường hộp cát và môi trường thực tế riêng biệt. Phương pháp này cho phép bạn phát triển và thử nghiệm trong môi trường nguồn cấp dữ liệu hộp cát của mình trước khi triển khai thay đổi vào phiên bản chính thức.
Ví dụ: nếu sử dụng Google Cloud Storage làm lựa chọn lưu trữ, bạn sẽ có: đường dẫn:
- Nguồn cấp dữ liệu Hộp cát:
gs://foorestaurant-google-feed-sandbox/
- Nguồn cấp dữ liệu sản xuất:
gs://foorestaurant-google-feed-prod/
Để lưu trữ khoảng không quảng cáo, hãy làm như sau:
- Tạo tệp nguồn cấp dữ liệu.
- Chọn một giải pháp lưu trữ.
- Lưu trữ nguồn cấp dữ liệu của bạn.
- Hãy đảm bảo rằng các tệp nguồn cấp dữ liệu của bạn được cập nhật thường xuyên. Bạn phải cập nhật nguồn cấp dữ liệu sản xuất mỗi ngày.
Để biết thông tin chi tiết về cách tạo nguồn cấp dữ liệu kho hàng, hãy xem tài liệu về
Restaurant
!
Service
!
và Menu
các tổ chức, cũng như
Tạo nguồn cấp dữ liệu
.
Nguyên tắc về tệp nguồn cấp dữ liệu
Mỗi tệp (có thể chứa nhiều thực thể) không được vượt quá 200 MB. Cấp cao nhất
các thực thể Restaurant
, Service
và Menu
, cùng với các thực thể
thực thể con không được vượt quá 4 MB.
Chọn một giải pháp lưu trữ
Bảng sau đây liệt kê các lựa chọn lưu trữ nguồn cấp dữ liệu và cách các máy chủ đó hoạt động Đặt hàng hoàn chỉnh:
Amazon S3 | Google Cloud Storage | HTTPS với sơ đồ trang web | |
---|---|---|---|
Thông tin xác thực và quyền truy cập |
Cung cấp cho Google những thông tin sau:
Bộ chứa S3 cần bao gồm những thông tin sau:
Ví dụ về tệp |
Cung cấp cho Google đường dẫn đến thư mục bộ chứa hộp cát và phiên bản phát hành công khai của bạn,
Tệp Thêm tài khoản dịch vụ do chuyên gia tư vấn của Google cung cấp làm tài khoản đọc tài khoản Google của bạn Bộ chứa Cloud Storage. Để biết thêm thông tin về cách kiểm soát quyền truy cập vào Google Cloud Storage (GCS), hãy xem Google Bảng điều khiển Cloud Platform: Đặt quyền truy cập vào bộ chứa. Bộ chứa GCS cần bao gồm những thông tin sau:
Ví dụ về tệp |
Cung cấp cho Google những thông tin sau:
|
Cách Google biết cần tìm nạp tệp nào | Danh sách thư mục của tất cả các tệp trong bộ chứa. | Danh sách thư mục của tất cả các tệp trong bộ chứa. | Các URL riêng lẻ của tệp được liệt kê trong sơ đồ trang web. |
Cách Google biết các tệp đã sẵn sàng tìm nạp | Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt
với dấu thời gian mới nhất. |
Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tệp marker.txt
với dấu thời gian mới nhất. |
Sau khi bạn tạo xong nguồn cấp dữ liệu, hãy cập nhật tiêu đề phản hồi
last-modified /sitemap.xml có dấu thời gian mới nhất. |
Giới hạn tệp |
Số lượng tệp tối đa: 100.000. Bạn phải có tổng số ít hơn 100.000 tệp trong bộ chứa Amazon S3 của mình. |
Số lượng tệp tối đa: 100.000. Bạn phải có tổng cộng ít hơn 100.000 tệp trong bộ chứa Google Cloud Storage. |
Số lượng tệp tối đa: 100.000. Số lượng đường dẫn tệp trong tệp XML sơ đồ trang web phải ít hơn 100.000. |
Kết nối nguồn cấp dữ liệu của bạn để nhập hàng loạt
Sau khi lưu trữ nguồn cấp dữ liệu, bạn cần kết nối chúng với dự án của mình trên Actions Center. Chiến lược phát hành đĩa đơn cấu hình ban đầu của nguồn cấp dữ liệu chính thức được thực hiện trên trang Việc cần làm trong quá trình làm quen. Sau này cấu hình nguồn cấp dữ liệu sản xuất và hộp cát có thể được cập nhật từ trang Cấu hình > Nguồn cấp dữ liệu bất kỳ lúc nào bởi bất kỳ người dùng cổng thông tin nào có vai trò quản trị. Môi trường hộp cát được dùng cho mục đích phát triển và thử nghiệm, trong khi nguồn cấp dữ liệu chính thức được hiển thị cho người dùng.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Amazon S3
- Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Phương thức phân phối nguồn cấp dữ liệu: Đặt thành Amazon S3.
- Tệp đánh dấu: Cung cấp URL của tệp
marker.txt
. - Tệp dữ liệu: Cung cấp URL cho bộ chứa S3 chứa nguồn cấp dữ liệu.
- Mã truy cập: Nhập mã khoá truy cập IAM có quyền đọc từ S3 của chúng tôi.
- Khoá truy cập: Nhập khoá truy cập bí mật IAM có quyền đọc từ S3 của chúng tôi.
- Nhấp vào Gửi.
- Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng Google Cloud Storage
- Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Cách phân phối nguồn cấp dữ liệu: Đặt thành Google Cloud Storage.
- Tệp đánh dấu: Cung cấp URL của tệp
marker.txt
. - Tệp dữ liệu: Cung cấp URL vào bộ chứa GCS chứa nguồn cấp dữ liệu.
- Nhấp vào Gửi.
- Một tài khoản dịch vụ được tạo để truy cập vào bộ chứa GCS của bạn. Bạn có thể tìm thấy tên tài khoản này trong Cấu hình > Nguồn cấp dữ liệu sau các nhiệm vụ giới thiệu đều đã hoàn tất. Tài khoản dịch vụ này cần có vai trò "Người đọc đối tượng cũ của bộ nhớ". Vai trò này có thể được cấp cho tài khoản dịch vụ trên trang IAM của bảng điều khiển Google Cloud.
- Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Nếu bạn lưu trữ nguồn cấp dữ liệu bằng HTTPS
- Trong Action Center, hãy chuyển đến phần Cấu hình > Nguồn cấp dữ liệu.
-
Nhấp vào Chỉnh sửa rồi điền vào biểu mẫu Cập nhật nguồn cấp dữ liệu:
- Cách phân phối nguồn cấp dữ liệu: Đặt thành HTTPS.
- Tệp sơ đồ trang web: Cung cấp URL của tệp
sitemap.xml
. - Tên người dùng: Nhập thông tin đăng nhập của tên người dùng để truy cập vào máy chủ HTTPS.
- Mật khẩu: Nhập mật khẩu để truy cập vào máy chủ HTTPS.
- Nhấp vào Gửi.
- Sau một đến hai giờ, hãy kiểm tra xem quy trình nhập hàng loạt có tìm nạp tệp nguồn cấp dữ liệu của bạn hay không.
Đường dẫn mẫu
Bảng sau đây chứa các đường dẫn mẫu cho từng lựa chọn lưu trữ:
Amazon S3 | Google Cloud Storage | HTTPS với sơ đồ trang web | |
---|---|---|---|
Đường dẫn | s3://foorestaurant-google-feed-sandbox/ |
gs://foorestaurant-google-feed-sandbox/ |
https://sandbox-foorestaurant.com/sitemap.xml |
Tệp đánh dấu | s3://foorestaurant-google-feed-sandbox/marker.txt |
gs://foorestaurant-google-feed-sandbox/marker.txt |
Không áp dụng |
Sơ đồ trang web dành cho việc lưu trữ HTTPS
Hãy làm theo các nguyên tắc sau khi bạn xác định sơ đồ trang web:
- Các đường liên kết trong sơ đồ trang web của bạn phải trỏ đến chính các tệp đó.
- Nếu sơ đồ trang web của bạn chứa thông tin tham chiếu đến một nhà cung cấp dịch vụ đám mây thay vì tên miền của riêng bạn,
hãy đảm bảo rằng phần đầu của URL, như
https://www.yourcloudprovider.com/your_id
, đều ổn định và là duy nhất cho công việc hàng loạt của bạn. - Hãy cẩn thận để không tải một phần sơ đồ trang web lên (chẳng hạn như trong trường hợp tải một phần dữ liệu lên). Đang thực hiện do đó, dẫn đến việc Google chỉ nhập các tệp trong sơ đồ trang web. Việc này sẽ khiến kho hàng của bạn giảm xuống và có thể khiến quá trình truyền dẫn nguồn cấp dữ liệu của bạn bị chặn.
- Đảm bảo rằng đường dẫn đến các tệp được tham chiếu trong sơ đồ trang web không thay đổi. Ví dụ: không nên
có tham chiếu đến sơ đồ trang web của bạn
https://www.yourcloudprovider.com/your_id/10000.json
ngay hôm nay, nhưng sau đó hãy tham khảohttps://www.yourcloudprovider.com/your_id/20000.json
ngày mai.
Sơ đồ trang web minh hoạ
Dưới đây là tệp sitemap.xml
mẫu phân phát các tệp nguồn cấp dữ liệu:
Ví dụ 1: Các đối tượng được nhóm theo người bán (Nên dùng).
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Ví dụ 2: Các thực thể được nhóm theo loại.
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/menu.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/service.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Cập nhật nguồn cấp dữ liệu
Sau khi nguồn cấp dữ liệu của bạn được kết nối, Google sẽ kiểm tra các bản cập nhật mỗi giờ một lần, nhưng chúng tôi chỉ nhập
tất cả nguồn cấp dữ liệu khi các tệp marker.txt
hoặc sitemap.xml
đã được
sửa đổi. Chúng tôi cần cập nhật nguồn cấp dữ liệu mỗi ngày một lần để ngăn kho hàng cũ.
Để xác định rằng nguồn cấp dữ liệu đã được sửa đổi và sẵn sàng để nhập hàng loạt, hãy cập nhật
Trường siêu dữ liệu đối tượng last-modified
của tệp marker.txt
(Dành cho GCP và
S3) hoặc tiêu đề phản hồi last-modified
của tệp sitemap.xml
. Điều khoản
sử dụng các giá trị này để xác định độ mới của nguồn cấp dữ liệu.
Khi nhập nguồn cấp dữ liệu hàng loạt,
- Thực thể mới không tồn tại trong khoảng không quảng cáo Đặt hàng hai đầu hiện tại của bạn và không có bất kỳ thực thể nào lỗi sẽ được chèn vào.
-
Thực thể đã có trong kho hàng và chưa có lỗi nào
và có
dateModified
gần đây hơn so với mục nhập hiện tại hoặc trong trường hợp không códateModified
thời gian bắt đầu nhập nguồn cấp dữ liệu gần đây hơn mục nhập hiện tại mà họ được cập nhật, nếu không thì chúng sẽ bị đánh dấu là cũ. - Thực thể thuộc một nguồn cấp dữ liệu trước đây nhưng không còn được đưa vào nguồn cấp dữ liệu lô đang được xử lý sẽ bị xoá, miễn là không có tệp nào trong nguồn cấp dữ liệu.
Bạn chỉ phải cập nhật dấu thời gian hoặc tiêu đề phản hồi last-modified
sau khi đã thu thập xong dữ liệu
các tệp nguồn cấp dữ liệu được tạo và cập nhật. Giới hạn để các công việc theo lô cập nhật nguồn cấp dữ liệu của bạn chỉ chạy
một lần/ngày. Ngoài ra, hãy cách nhau ít nhất 3 giờ giữa mỗi công việc hàng loạt. Nếu không
hãy thực hiện các bước sau, Google có thể tìm nạp các tệp cũ.