Penyerapan batch

Feed data Anda memungkinkan Anda membuat restoran, layanan, dan menu Anda tersedia di Pemesanan Menyeluruh.

Dokumen ini membahas cara menghosting inventaris sandbox dan produksi serta menggunakan penyerapan batch untuk memperbarui inventaris dalam Pemesanan Menyeluruh.

Lingkungan feed data

Ada tiga lingkungan feed data yang tersedia untuk pengembangan integrasi Anda:

Lingkungan feed Deskripsi Penyerapan batch
Kotak Pasir Lingkungan pengujian untuk pengembangan feed Anda. Wajib
Produksi Lingkungan produksi untuk inventaris yang ingin Anda luncurkan. Wajib

Menghosting feed data

Agar Pemesanan Menyeluruh untuk memproses feed data Sandbox dan Produksi berdasarkan batch penyerapan, Anda harus menghosting file feed data di Google Cloud Storage, Amazon S3, atau HTTPS dengan {i>sitemap<i}.

Sebaiknya Anda menghosting feed data untuk lingkungan sandbox dan produksi secara terpisah. Dengan pendekatan ini, Anda dapat melakukan pengembangan dan pengujian di lingkungan feed sandbox sebelum menerapkan perubahan pada produksi.

Misalnya, jika Anda menggunakan Google Cloud Storage sebagai opsi hosting, Anda akan memiliki jalur:

  • Feed Sandbox: gs://foorestaurant-google-feed-sandbox/
  • Feed Produksi: gs://foorestaurant-google-feed-prod/

Untuk menghosting inventaris Anda, lakukan tindakan berikut:

  1. Buat file feed data Anda.
  2. Pilih solusi hosting.
  3. Menghosting feed data Anda.
  4. Pastikan file feed data Anda diperbarui secara rutin. Feed data produksi harus diperbarui per hari.

Untuk mengetahui detail tentang cara membuat feed inventaris, lihat dokumentasi untuk Restaurant, Service, dan Menu entitas, serta Buat feed data bagian.

Panduan terkait file feed data

Setiap file, yang dapat berisi beberapa entitas, tidak boleh melebihi 200 MB. Tingkat teratas entitas Restaurant, Service, dan Menu, beserta entitas turunan, tidak boleh melebihi 4 MB sekaligus.

Memilih solusi hosting

Tabel berikut mencantumkan opsi untuk menghosting feed data Anda dan cara kerja host tersebut dengan host tersebut Pemesanan Menyeluruh:

Amazon S3 Google Cloud Storage HTTPS dengan peta situs
Kredensial dan akses

Berikan informasi berikut kepada Google:

  • ID kunci akses
  • Kunci akses rahasia
  • Jalur ke direktori produksi dan sandbox S3 dan marker.txt Anda . Jalur harus diawali dengan s3://.

Bucket S3 harus menyertakan informasi berikut:

  • File feed untuk inventaris Anda.
  • marker.txt, yang berisi stempel waktu yang digunakan untuk pengambilan.

Contoh file marker.txt: 2018-12-03T08:30:42.694Z

Beri Google jalur ke direktori produksi dan bucket sandbox serta File marker.txt. Jalur harus diawali dengan gs://.

Tambahkan akun layanan yang disediakan oleh konsultan Google Anda sebagai pembaca akun Google bucket Cloud Storage.

Untuk informasi selengkapnya tentang cara mengontrol akses untuk Google Cloud Storage (GCS), lihat Google Cloud Platform Console: Menetapkan izin bucket.

Bucket GCS harus menyertakan informasi berikut:

  • File feed untuk inventaris Anda.
  • marker.txt, yang berisi stempel waktu yang digunakan untuk pengambilan.

Contoh file marker.txt: 2018-12-03T08:30:42.694Z

Berikan informasi berikut kepada Google:

  • Kredensial ke autentikasi dasar.
  • Jalur ke jalur peta situs produksi dan sandbox Anda. Jalur harus diawali dengan https://.
  • Protokol: Anda harus membuat file feed tersedia melalui HTTPS, bukan HTTP.
  • Keamanan: Google sangat menyarankan agar Anda melindungi file feed yang dihosting dengan Autentikasi Dasar.
Cara Google mengetahui file mana yang perlu diambil Listingan direktori semua file dalam bucket. Listingan direktori semua file dalam bucket. Tiap URL file yang tercantum dalam peta situs.
Cara Google mengetahui bahwa file siap diambil Setelah Anda selesai membuat feed data, perbarui file marker.txt dengan stempel waktu terbaru. Setelah Anda selesai membuat feed data, perbarui file marker.txt dengan stempel waktu terbaru. Setelah Anda selesai membuat feed data, perbarui header respons last-modified dari sitemap.xml Anda dengan stempel waktu terbaru.
Batasan file

Jumlah file maksimum: 100.000.

Anda harus memiliki total kurang dari 100.000 file di bucket Amazon S3.

Jumlah file maksimum: 100.000.

Total file Anda tidak boleh lebih dari 100.000 di bucket Google Cloud Storage.

Jumlah file maksimum: 100.000.

Jumlah jalur file dalam file XML peta situs Anda tidak boleh lebih dari 100.000.

Menghubungkan feed data untuk penyerapan batch

Setelah menghosting feed, Anda harus menghubungkannya ke project di Actions Center. Tujuan konfigurasi awal feed produksi dilakukan di halaman Orientasi Tasks. Nanti konfigurasi feed produksi dan sandbox dapat diperbarui dari halaman Konfigurasi &gt; Feed kapan saja oleh pengguna portal mana pun dengan administratif. Lingkungan {i>sandbox<i} digunakan untuk tujuan pengembangan dan pengujian, sementara feed produksi ditampilkan kepada pengguna.

Jika Anda menghosting feed data dengan Amazon S3

  1. Di Actions Center, buka Konfigurasi &gt; Feed.
  2. Klik Edit dan isi formulir Perbarui Feed:

    • Metode penayangan feed: Setel ke Amazon S3.
    • File Penanda: Berikan URL file marker.txt.
    • File Data: Berikan URL ke bucket S3 yang berisi feed data.
    • ID Akses: Masukkan ID kunci akses IAM dengan izin untuk membaca dari S3 Google Cloud Platform.
    • Kunci Akses: Masukkan kunci akses rahasia IAM dengan izin untuk membaca dari S3 Google Cloud Platform.
  3. Klik Kirim.
  4. Setelah satu hingga dua jam, periksa apakah penyerapan batch mengambil file feed Anda.

Jika Anda menghosting feed data dengan Google Cloud Storage

  1. Di Actions Center, buka Konfigurasi &gt; Feed.
  2. Klik Edit dan isi formulir Perbarui Feed:

    • Metode pengiriman feed: Setel ke Google Cloud Storage.
    • File Penanda: Berikan URL file marker.txt.
    • File Data: Berikan URL ke bucket GCS yang berisi feed data.
  3. Klik Kirim.
  4. Akun layanan dibuat untuk mengakses bucket GCS Anda. Nama akun dapat ditemukan di Konfigurasi &gt; Feed setelah tugas orientasi telah selesai. Akun layanan ini memerlukan peran “Storage Legacy Object Reader”. Peran ini dapat diizinkan ke akun layanan di halaman IAM pada Konsol Google Cloud.
  5. Setelah satu hingga dua jam, periksa apakah penyerapan batch mengambil file feed Anda.

Jika Anda menghosting feed data dengan HTTPS

  1. Di Actions Center, buka Konfigurasi &gt; Feed.
  2. Klik Edit dan isi formulir Perbarui Feed:

    • Metode penayangan feed: Tetapkan ke HTTPS.
    • File Peta Situs: Berikan URL file sitemap.xml.
    • Nama pengguna: Masukkan kredensial nama pengguna untuk mengakses server HTTPS.
    • Sandi: Masukkan sandi untuk mengakses server HTTPS.
  3. Klik Kirim.
  4. Setelah satu hingga dua jam, periksa apakah penyerapan batch mengambil file feed Anda.

Contoh jalur

Tabel berikut berisi contoh jalur untuk setiap opsi hosting:

Amazon S3 Google Cloud Storage HTTPS dengan peta situs
Jalur s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
File penanda s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Tidak berlaku

Peta situs untuk hosting HTTPS

Gunakan panduan berikut saat Anda menentukan peta situs:

  • Tautan di {i>sitemap<i} Anda harus mengarah ke file itu sendiri.
  • Jika {i>sitemap<i} Anda menyertakan referensi ke penyedia {i>cloud<i}, bukan nama domain Anda sendiri, pastikan bahwa awal URL, seperti https://www.yourcloudprovider.com/your_id, stabil dan unik untuk tugas batch Anda.
  • Berhati-hatilah agar tidak mengupload peta situs sebagian (seperti jika upload data sebagian). Melakukan sehingga Google hanya menyerap file di peta situs, sehingga inventaris Anda level turun dan dapat menyebabkan penyerapan feed Anda diblokir.
  • Pastikan jalur ke file yang dirujuk di peta situs tidak berubah. Misalnya, jangan minta referensi peta situs Anda https://www.yourcloudprovider.com/your_id/10000.json hari ini, tetapi kemudian referensikan https://www.yourcloudprovider.com/your_id/20000.json besok.
Contoh peta situs

Berikut adalah contoh file sitemap.xml yang menayangkan file feed data:

Contoh 1: Entitas yang dikelompokkan berdasarkan penjual (Direkomendasikan).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Contoh 2: Entity yang dikelompokkan menurut jenis.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Memperbarui feed data

Setelah feed data Anda terhubung, Google akan memeriksa pembaruan satu kali setiap jam, tetapi kami hanya menyerap semua feed data saat file marker.txt atau sitemap.xml telah diubah. Kami harap Anda memperbarui feed data sekali sehari untuk mencegah inventaris usang.

Untuk menentukan bahwa feed data telah diubah dan siap untuk penyerapan batch, perbarui Kolom metadata objek last-modified file marker.txt (Untuk GCP dan S3) atau header respons last-modified dari file sitemap.xml. Kebijakan Privasi menggunakan nilai ini untuk menentukan seberapa baru feed data.

Saat feed batch ditransfer,

  • Entitas baru yang tidak ada di inventaris End-to-End Pemesanan Anda saat ini dan tidak memiliki akan disisipkan.
  • Entitas yang sudah ada dalam inventaris yang tidak memiliki error penyerapan yang lebih lama dan memiliki dateModified yang lebih baru entri saat ini atau jika tidak memiliki dateModified, waktu mulai penyerapan feed lebih baru daripada entri saat ini yang akan mereka diperbarui, jika tidak, mereka akan ditandai sebagai usang.
  • Entitas yang merupakan bagian dari feed sebelumnya yang tidak lagi disertakan dalam feed batch yang sedang diproses akan dihapus, asalkan tidak ada file tingkat error dalam feed.

Stempel waktu atau header respons last-modified harus diperbarui hanya setelah semua data file feed dibuat dan diperbarui. Membatasi tugas batch yang memperbarui feed data Anda agar hanya dijalankan sekali sehari. Atau, berikan jeda minimal tiga jam di antara setiap tugas batch. Jika Anda tidak mengambil langkah-langkah ini, Google mungkin mengambil file yang sudah usang.