Pliki danych umożliwiają udostępnianie informacji o restauracji, usługach i menu w usłudze zamawiania od początku do końca.
Z tego dokumentu dowiesz się, jak hostować swoje zasoby w piaskownicy i w środowisku produkcyjnym oraz jak używać zbiorczego przetwarzania, aby aktualizować asortyment w ramach kompleksowego zamawiania.
Środowiska plików danych
Do tworzenia integracji dostępne są 3 środowiska plików danych:
Środowisko pliku danych | Opis | Przetwarzanie wsadowe |
---|---|---|
Tryb piaskownicy | Środowisko testowe do tworzenia kanału. | Wymagane |
Produkcja | Środowisko produkcyjne dla zasobów reklamowych, które chcesz wdrożyć. | Wymagane |
Hostowane pliki danych
Aby usługa kompleksowego zamawiania mogła przetwarzać pliki danych z piaskownicy i produkcji za pomocą przetwarzania zbiorczego, musisz hostować pliki danych w Google Cloud Storage, Amazon S3 lub HTTPS za pomocą mapy witryny.
Zalecamy, aby pliki danych dla środowiska piaskownicy i produkcyjnego były hostowane osobno. Dzięki temu możesz prowadzić prace programistyczne i testy w środowisku pliku danych w piaskownicy, zanim wdrożysz zmiany w produkcji.
Jeśli na przykład używasz Google Cloud Storage jako opcji hostingu, masz do dyspozycji te ścieżki:
- Plik danych piaskownicy:
gs://foorestaurant-google-feed-sandbox/
- Plik danych o produkcji:
gs://foorestaurant-google-feed-prod/
Aby hostować zasoby reklamowe:
- Wygeneruj pliki pliku danych.
- Wybierz rozwiązanie hostingowe.
- Hostowanie plików danych.
- Pamiętaj, aby regularnie aktualizować pliki danych. Pliki danych produkcyjnych muszą być aktualizowane codziennie.
Szczegółowe informacje o tworzeniu pliku danych o asortymencie znajdziesz w dokumentacji dotyczącej elementów Restaurant
, Service
i Menu
, a także w sekcji Tworzenie pliku danych.
Wytyczne dotyczące plików danych
Każdy plik, który może zawierać wiele elementów, nie może przekraczać 200 MB. Elementy najwyższego poziomu Restaurant
, Service
i Menu
wraz z elementami podrzędnymi nie mogą razem zajmować więcej niż 4 MB.
Wybieranie rozwiązania hostingowego
W tabeli poniżej znajdziesz opcje hostowania plików danych i informacje o tym, jak te hosty współpracują z usługą Zamawianie od początku do końca:
Amazon S3 | Google Cloud Storage | HTTPS z mapą witryny | |
---|---|---|---|
Dane logowania i dostęp |
Podaj Google te informacje:
Kontener S3 musi zawierać te informacje:
Przykładowy plik |
Podaj Google ścieżki do katalogów puli produkcyjnej i piaskownicy oraz pliku Dodaj konto usługi podane przez konsultanta Google jako konto czytelnika zasobnika Google Cloud Storage. Więcej informacji o sterowaniu dostępem do Google Cloud Storage (GCS) znajdziesz w artykule Kontrolowanie dostępu w konsoli Google Cloud Platform: ustawianie uprawnień zasobnika. Kosz GCS musi zawierać te informacje:
Przykładowy plik |
Podaj Google te informacje:
|
Skąd Google wie, które pliki należy pobrać | Katalog zawierający wszystkie pliki w zasobniku. | Katalog zawierający wszystkie pliki w zasobniku. | Pojedyncze adresy URL plików wymienionych w mapie witryny. |
Jak Google wie, że pliki są gotowe do pobrania | Po wygenerowaniu plików danych zaktualizuj plik marker.txt , dodając do niego najnowszą sygnaturę czasową. |
Po wygenerowaniu plików danych zaktualizuj plik marker.txt , dodając do niego najnowszą sygnaturę czasową. |
Po wygenerowaniu plików danych zaktualizuj nagłówek odpowiedzi last-modified w pliku sitemap.xml , podając najnowszą sygnaturę czasową. |
Limity plików |
Maksymalna liczba plików: 100 tys. W zasośniku Amazon S3 musi być mniej niż 100 tys. plików. |
Maksymalna liczba plików: 100 tys. W zasobniku Google Cloud Storage musi być mniej niż 100 tys. plików. |
Maksymalna liczba plików: 100 tys. Liczba ścieżek do plików w pliku XML mapy witryny nie może przekraczać 100 tys. ścieżek. |
Łączenie plików danych do zbiorczego przetwarzania
Po przesłaniu plików danych musisz je połączyć z projektem w Centrum Actions. Początkowa konfiguracja plików danych produkcyjnych jest wykonywana na stronie Obowiązki w ramach wprowadzenia. Później konfigurację plików danych w produkcji i sandbox można zaktualizować w dowolnym momencie na stronie Konfiguracja > Pliki danych przez dowolnego użytkownika portalu mającego rolę administracyjną. Piaskownica służy do celów programowania i testowania, a pliki danych w wersji produkcyjnej są wyświetlane użytkownikom.
Jeśli pliki danych hostujesz w Amazon S3
- W Centrum działań kliknij Konfiguracja > Pliki danych.
-
Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:
- Metoda dostarczania pliku danych: wybierz Amazon S3.
- Plik znacznika: podaj adres URL pliku
marker.txt
. - Pliki danych: podaj adres URL zasobnika S3 zawierającego pliki danych.
- Identyfikator dostępu: wpisz identyfikator klucza dostępu z uprawnieniami do odczytu zasobów S3.
- Klucz dostępu:wpisz tajny klucz dostępu IAM z uprawnieniami do odczytu zasobów S3.
- Kliknij Prześlij.
- Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.
Jeśli pliki danych hostujesz w Google Cloud Storage
- W Centrum działań kliknij Konfiguracja > Pliki danych.
-
Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:
- Metoda dostarczania pliku danych: ustaw na Google Cloud Storage.
- Plik znacznika: podaj adres URL pliku
marker.txt
. - Pliki danych: podaj adres URL zasobnika GCS zawierającego pliki danych.
- Kliknij Prześlij.
- Tworzone jest konto usługi, które ma dostęp do zasobnika GCS. Nazwę konta znajdziesz w sekcji Konfiguracja > Pliki danych po zakończeniu zadań wstępnych. To konto usługi musi mieć rolę „Storage Legacy Object Reader”. Tę rolę możesz przypisać do konta usługi na stronie Uprawnienia w konsoli Google Cloud.
- Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.
Jeśli hostujesz pliki danych z HTTPS
- W Centrum działań kliknij Konfiguracja > Pliki danych.
-
Kliknij Edytuj i wypełnij formularz Aktualizuj plik danych:
- Metoda przesyłania pliku danych: ustaw na HTTPS.
- Plik mapy witryny: podaj adres URL pliku
sitemap.xml
. - Nazwa użytkownika: wpisz dane logowania do serwera HTTPS.
- Hasło: wpisz hasło, aby uzyskać dostęp do serwera HTTPS.
- Kliknij Prześlij.
- Po 1–2 godzinach sprawdź, czy przetwarzanie zbiorcze pobiera pliki danych.
Przykładowe ścieżki
Poniższa tabela zawiera przykładowe ścieżki dla poszczególnych opcji hostingu:
Amazon S3 | Google Cloud Storage | HTTPS z mapą witryny | |
---|---|---|---|
Ścieżka | s3://foorestaurant-google-feed-sandbox/ |
gs://foorestaurant-google-feed-sandbox/ |
https://sandbox-foorestaurant.com/sitemap.xml |
Plik znacznika | s3://foorestaurant-google-feed-sandbox/marker.txt |
gs://foorestaurant-google-feed-sandbox/marker.txt |
Nie dotyczy |
Mapy witryn dla hostingu HTTPS
Podczas definiowania map witryn kieruj się tymi wskazówkami:
- Linki w mapie witryny muszą wskazywać na same pliki.
- Jeśli mapa witryny zawiera odwołania do dostawcy usług w chmurze zamiast do Twojej domeny, zadbaj o to, aby początek adresów URL, np.
https://www.yourcloudprovider.com/your_id
, był stabilny i niepowtarzalny dla Twojego zadania zbiorczego. - Uważaj, aby nie przesyłać częściowych map witryn (np. w przypadku częściowego przesyłania danych). W efekcie Google przetwarza tylko pliki z mapy witryny, co spowoduje spadek poziomu zasobów reklamowych i może spowodować zablokowanie przetwarzania pliku danych.
- Upewnij się, że ścieżki do plików wymienionych w mapie witryny nie ulegają zmianie. Na przykład nie odwołuj się dzisiaj w mapie witryny do adresu
https://www.yourcloudprovider.com/your_id/10000.json
, a jutro do adresuhttps://www.yourcloudprovider.com/your_id/20000.json
.
Przykładowa mapa witryny
Oto przykładowy plik sitemap.xml
, który udostępnia pliki danych:
Przykład 1. Elementy pogrupowane według sprzedawców (zalecane).
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Przykład 2. Elementy pogrupowane według typów.
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/menu.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/service.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
Aktualizowanie plików danych
Gdy pliki danych są połączone, Google sprawdza je co godzinę, ale przetwarzamy wszystkie pliki danych tylko wtedy, gdy pliki marker.txt
lub sitemap.xml
zostały zmodyfikowane. Oczekujemy, że będziesz aktualizować pliki danych raz dziennie, aby uniknąć przestarzałego asortymentu.
Aby wskazać, że pliki danych zostały zmodyfikowane i są gotowe do zbiorczego przetwarzania, zaktualizuj pole metadanych obiektu last-modified
w pliku marker.txt
(w przypadku GCP i S3) lub nagłówek odpowiedzi last-modified
w pliku sitemap.xml
. Google używa tych wartości do określenia, jak aktualny jest plik danych.
Podczas przetwarzania zbiorczego pliku danych:
- Wstawiane są nowe elementy, które nie występują w bieżącym katalogu produktów w ramach usługi kompleksowego zamawiania i nie zawierają żadnych błędów.
-
Elementy już obecne w zasobach reklamowych, które nie zawierają żadnych błędów podczas przetwarzania i mają
dateModified
nowszy niż ich bieżący wpis lub w przypadku brakudateModified
czas rozpoczęcia przetwarzania pliku danych jest nowszy niż bieżący wpis, zostaną zaktualizowane. W przeciwnym razie zostaną oznaczone jako nieaktualne. - Elementy, które były częścią poprzedniego pliku danych, a nie są już uwzględnione w przetwarzanym pliku danych zbiorczego, zostaną usunięte, o ile w pliku nie ma błędów na poziomie pliku.
Znak czasu lub nagłówek odpowiedzi last-modified
należy zaktualizować dopiero po wygenerowaniu i zaktualizowaniu wszystkich plików danych. Ogranicz zadania zbiorcze, które aktualizują pliki danych, do uruchamiania tylko raz dziennie. Możesz też zachować co najmniej 3 godziny przerwy między każdym zadaniem zbiorczym. Jeśli tego nie zrobisz, Google może pobrać nieaktualne pliki.