Przetwarzanie wsadowe

Pliki danych umożliwiają udostępnianie informacji o restauracji, usługach i menu w usłudze zamawiania od początku do końca.

Z tego dokumentu dowiesz się, jak hostować swoje zasoby w piaskownicy i w środowisku produkcyjnym oraz jak używać zbiorczego przetwarzania, aby aktualizować asortyment w ramach kompleksowego zamawiania.

Środowiska plików danych

Do tworzenia integracji dostępne są 3 środowiska plików danych:

Środowisko pliku danych Opis Przetwarzanie wsadowe
Tryb piaskownicy Środowisko testowe do tworzenia kanału. Wymagane
Produkcja Środowisko produkcyjne dla zasobów reklamowych, które chcesz wdrożyć. Wymagane

Hostowane pliki danych

Aby usługa kompleksowego zamawiania mogła przetwarzać pliki danych z piaskownicy i produkcji za pomocą przetwarzania zbiorczego, musisz hostować pliki danych w Google Cloud Storage, Amazon S3 lub HTTPS za pomocą mapy witryny.

Zalecamy, aby pliki danych dla środowiska piaskownicy i produkcyjnego były hostowane osobno. Dzięki temu możesz prowadzić prace programistyczne i testy w środowisku pliku danych w piaskownicy, zanim wdrożysz zmiany w produkcji.

Jeśli na przykład używasz Google Cloud Storage jako opcji hostingu, masz do dyspozycji te ścieżki:

  • Plik danych piaskownicy: gs://foorestaurant-google-feed-sandbox/
  • Plik danych o produkcji: gs://foorestaurant-google-feed-prod/

Aby hostować zasoby reklamowe:

  1. Wygeneruj pliki pliku danych.
  2. Wybierz rozwiązanie hostingowe.
  3. Hostowanie plików danych.
  4. Pamiętaj, aby regularnie aktualizować pliki danych. Pliki danych produkcyjnych muszą być aktualizowane codziennie.

Szczegółowe informacje o tworzeniu pliku danych o asortymencie znajdziesz w dokumentacji dotyczącej elementów Restaurant, Service i Menu, a także w sekcji Tworzenie pliku danych.

Wytyczne dotyczące plików danych

Każdy plik, który może zawierać wiele elementów, nie może przekraczać 200 MB. Elementy najwyższego poziomu Restaurant, Service i Menu wraz z elementami podrzędnymi nie mogą razem zajmować więcej niż 4 MB.

Wybieranie rozwiązania hostingowego

W tabeli poniżej znajdziesz opcje hostowania plików danych i informacje o tym, jak te hosty współpracują z usługą Zamawianie od początku do końca:

Amazon S3 Google Cloud Storage HTTPS z mapą witryny
Dane logowania i dostęp

Podaj Google te informacje:

  • Identyfikator klucza dostępu
  • Tajny klucz dostępu
  • Ścieżki do katalogów S3 w środowisku produkcyjnym i piaskownicy oraz do pliku marker.txt. Ścieżka musi zaczynać się od s3://.

Kontener S3 musi zawierać te informacje:

  • pliki danych o asortymencie,
  • marker.txt, który zawiera sygnaturę czasową używaną do pobierania.

Przykładowy plik marker.txt: 2018-12-03T08:30:42.694Z

Podaj Google ścieżki do katalogów puli produkcyjnej i piaskownicy oraz pliku marker.txt. Ścieżki muszą zaczynać się od gs://.

Dodaj konto usługi podane przez konsultanta Google jako konto czytelnika zasobnika Google Cloud Storage.

Więcej informacji o sterowaniu dostępem do Google Cloud Storage (GCS) znajdziesz w artykule Kontrolowanie dostępu w konsoli Google Cloud Platform: ustawianie uprawnień zasobnika.

Kosz GCS musi zawierać te informacje:

  • pliki danych o asortymencie,
  • marker.txt, który zawiera sygnaturę czasową używaną do pobierania.

Przykładowy plik marker.txt: 2018-12-03T08:30:42.694Z

Podaj Google te informacje:

  • Dane uwierzytelniające do podstawowego uwierzytelniania.
  • Ścieżki do mapy witryny w wersji produkcyjnej i w piaskownicy. Ścieżka musi zaczynać się od https://.
  • Protokół: pliki danych musisz udostępniać za pomocą protokołu HTTPS, a nie HTTP.
  • Bezpieczeństwo: Google zdecydowanie zaleca zabezpieczenie hostowanych plików danych za pomocą podstawowego uwierzytelniania.
Skąd Google wie, które pliki należy pobrać Katalog zawierający wszystkie pliki w zasobniku. Katalog zawierający wszystkie pliki w zasobniku. Pojedyncze adresy URL plików wymienionych w mapie witryny.
Jak Google wie, że pliki są gotowe do pobrania Po wygenerowaniu plików danych zaktualizuj plik marker.txt, dodając do niego najnowszą sygnaturę czasową. Po wygenerowaniu plików danych zaktualizuj plik marker.txt, dodając do niego najnowszą sygnaturę czasową. Po wygenerowaniu plików danych zaktualizuj nagłówek odpowiedzi last-modified w pliku sitemap.xml, podając najnowszą sygnaturę czasową.
Limity plików

Maksymalna liczba plików: 100 tys.

W zasośniku Amazon S3 musi być mniej niż 100 tys. plików.

Maksymalna liczba plików: 100 tys.

W zasobniku Google Cloud Storage musi być mniej niż 100 tys. plików.

Maksymalna liczba plików: 100 tys.

Liczba ścieżek do plików w pliku XML mapy witryny nie może przekraczać 100 tys. ścieżek.

Łączenie plików danych do zbiorczego przetwarzania

Po przesłaniu plików danych musisz je połączyć z projektem w Centrum Actions. Początkowa konfiguracja plików danych produkcyjnych jest wykonywana na stronie Obowiązki w ramach wprowadzenia. Później konfigurację plików danych w produkcji i sandbox można zaktualizować w dowolnym momencie na stronie Konfiguracja > Pliki danych przez dowolnego użytkownika portalu mającego rolę administracyjną. Piaskownica służy do celów programowania i testowania, a pliki danych w wersji produkcyjnej są wyświetlane użytkownikom.

Jeśli pliki danych hostujesz w Amazon S3

  1. W Centrum działań kliknij Konfiguracja > Pliki danych.
  2. Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:

    • Metoda dostarczania pliku danych: wybierz Amazon S3.
    • Plik znacznika: podaj adres URL pliku marker.txt.
    • Pliki danych: podaj adres URL zasobnika S3 zawierającego pliki danych.
    • Identyfikator dostępu: wpisz identyfikator klucza dostępu z uprawnieniami do odczytu zasobów S3.
    • Klucz dostępu:wpisz tajny klucz dostępu IAM z uprawnieniami do odczytu zasobów S3.
  3. Kliknij Prześlij.
  4. Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.

Jeśli pliki danych hostujesz w Google Cloud Storage

  1. W Centrum działań kliknij Konfiguracja > Pliki danych.
  2. Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:

    • Metoda dostarczania pliku danych: ustaw na Google Cloud Storage.
    • Plik znacznika: podaj adres URL pliku marker.txt.
    • Pliki danych: podaj adres URL zasobnika GCS zawierającego pliki danych.
  3. Kliknij Prześlij.
  4. Tworzone jest konto usługi, które ma dostęp do zasobnika GCS. Nazwę konta znajdziesz w sekcji Konfiguracja > Pliki danych po zakończeniu zadań wstępnych. To konto usługi musi mieć rolę „Storage Legacy Object Reader”. Tę rolę możesz przypisać do konta usługi na stronie Uprawnienia w konsoli Google Cloud.
  5. Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.

Jeśli hostujesz pliki danych z HTTPS

  1. W Centrum działań kliknij Konfiguracja > Pliki danych.
  2. Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:

    • Metoda przesyłania pliku danych: ustaw na HTTPS.
    • Plik mapy witryny: podaj adres URL pliku sitemap.xml.
    • Nazwa użytkownika: wpisz dane logowania do serwera HTTPS.
    • Hasło: wpisz hasło, aby uzyskać dostęp do serwera HTTPS.
  3. Kliknij Prześlij.
  4. Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.

Przykładowe ścieżki

Poniższa tabela zawiera przykładowe ścieżki dla poszczególnych opcji hostingu:

Amazon S3 Google Cloud Storage HTTPS z mapą witryny
Ścieżka s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
Plik znacznika s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Nie dotyczy

Mapy witryn dla hostingu HTTPS

Podczas definiowania map witryn kieruj się tymi wskazówkami:

  • Linki w mapie witryny muszą wskazywać na same pliki.
  • Jeśli mapa witryny zawiera odwołania do dostawcy usług w chmurze zamiast do Twojej domeny, zadbaj o to, aby początek adresów URL, np. https://www.yourcloudprovider.com/your_id, był stabilny i niepowtarzalny dla Twojego zadania zbiorczego.
  • Uważaj, aby nie przesyłać częściowych map witryn (np. w przypadku częściowego przesyłania danych). W efekcie Google przetwarza tylko pliki z mapy witryny, co spowoduje spadek poziomu zasobów reklamowych i może spowodować zablokowanie przetwarzania pliku danych.
  • Upewnij się, że ścieżki do plików wymienionych w mapie witryny nie ulegają zmianie. Na przykład nie odwołuj się dzisiaj w mapie witryny do adresu https://www.yourcloudprovider.com/your_id/10000.json, a jutro do adresu https://www.yourcloudprovider.com/your_id/20000.json.
Przykładowa mapa witryny

Oto przykładowy plik sitemap.xml, który udostępnia pliki danych:

Przykład 1. Elementy pogrupowane według sprzedawców (zalecane).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Przykład 2. Elementy pogrupowane według typów.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Aktualizowanie plików danych

Gdy pliki danych są połączone, Google sprawdza je co godzinę, ale przetwarzamy wszystkie pliki danych tylko wtedy, gdy pliki marker.txt lub sitemap.xml zostały zmodyfikowane. Oczekujemy, że będziesz aktualizować pliki danych raz dziennie, aby uniknąć przestarzałego asortymentu.

Aby wskazać, że pliki danych zostały zmodyfikowane i są gotowe do zbiorczego przetwarzania, zaktualizuj pole metadanych obiektu last-modified w pliku marker.txt (w przypadku GCP i S3) lub nagłówek odpowiedzi last-modified w pliku sitemap.xml. Google używa tych wartości do określenia, jak aktualny jest plik danych.

Podczas przetwarzania zbiorczego pliku danych:

  • Wstawiane są nowe elementy, które nie występują w bieżącym katalogu produktów w ramach usługi kompleksowego zamawiania i nie zawierają żadnych błędów.
  • Elementy już obecne w zasobach reklamowych, które nie zawierają żadnych błędów podczas przetwarzania i mają dateModified nowszy niż ich bieżący wpis lub w przypadku braku dateModified czas rozpoczęcia przetwarzania pliku danych jest nowszy niż bieżący wpis, zostaną zaktualizowane. W przeciwnym razie zostaną oznaczone jako nieaktualne.
  • Elementy, które były częścią poprzedniego pliku danych, a nie są już uwzględnione w przetwarzanym pliku danych zbiorczego, zostaną usunięte, o ile w pliku nie ma błędów na poziomie pliku.

Znak czasu lub nagłówek odpowiedzi last-modified należy zaktualizować dopiero po wygenerowaniu i zaktualizowaniu wszystkich plików danych. Ogranicz zadania zbiorcze, które aktualizują pliki danych, do uruchamiania tylko raz dziennie. Możesz też zachować co najmniej 3 godziny przerwy między każdym zadaniem zbiorczym. Jeśli tego nie zrobisz, Google może pobrać nieaktualne pliki.