تسمح خلاصات البيانات تجعل مطعمك وخدماتك وقائمتك متوفرة في عملية الطلب الشاملة.
يتناول هذا المستند كيفية استضافة مستودعات وضع الحماية والإنتاج وكيفية استخدام ميزة العرض المجمَّع. لتحديث المخزون الخاص بك في "الطلب من البداية إلى النهاية".
بيئات خلاصات البيانات
تتوفّر ثلاث بيئات لخلاصات البيانات من أجل تطوير الدمج:
بيئة الخلاصة | الوصف | العرض المجمَّع |
---|---|---|
وضع الحماية | بيئة الاختبار لتطوير خلاصتك | مطلوب |
الإنتاج | بيئة الإنتاج لمستودعك الذي تريد إطلاقه. | مطلوب |
استضافة خلاصات البيانات
من أجل إجراء الطلب بشكل شامل لمعالجة خلاصات بيانات "وضع الحماية" و"الإنتاج" بشكلٍ مجمّع نقل البيانات، يجب استضافة ملفات خلاصة البيانات في Google Cloud Storage أو Amazon S3 أو HTTPS من خلال خريطة الموقع.
ننصحك باستضافة خلاصات البيانات في بيئات وضع الحماية والإنتاج. على حدة. تتيح لك هذه الطريقة إجراء التطوير والاختبار في بيئة خلاصة وضع الحماية. قبل نشر التغييرات في مرحلة الإنتاج.
على سبيل المثال، إذا كنت تستخدم Google Cloud Storage كخيار استضافة، سيكون لديك ما يلي: المسارات:
- خلاصة وضع الحماية:
gs://foorestaurant-google-feed-sandbox/
- خلاصة الإنتاج:
gs://foorestaurant-google-feed-prod/
لاستضافة مستودعك، اتّبِع الخطوات التالية:
- أنشِئ ملفات خلاصة البيانات.
- اختَر أحد حلول الاستضافة.
- استضِف خلاصات بياناتك.
- احرص على تعديل ملفات خلاصة البيانات بانتظام. يجب تعديل خلاصات بيانات الإنتاج يوميًا.
لمزيد من التفاصيل حول كيفية إنشاء خلاصة مستودع، يُرجى الاطّلاع على مستندات
Restaurant
,
Service
،
وMenu
الكيانات، بالإضافة إلى
إنشاء خلاصة بيانات
.
إرشادات بشأن ملفات خلاصات البيانات
يجب ألا يتجاوز كل ملف، يمكن أن يحتوي على كيانات متعددة، 200 ميغابايت. المستوى الأعلى
الكيانات Restaurant
وService
وMenu
بالإضافة إلى
الكيانات الفرعية، يجب ألا يتجاوز حجمها 4 ميغابايت معًا.
اختيار حل استضافة
يسرد الجدول التالي خيارات استضافة خلاصات البيانات وطريقة عمل تلك المضيفات. عملية الطلب الشاملة:
Amazon S3 | Google Cloud Storage | HTTPS مع خريطة موقع | |
---|---|---|---|
بيانات الاعتماد وإمكانية الوصول |
يُرجى تقديم المعلومات التالية إلى Google:
يجب أن تتضمّن حزمة S3 المعلومات التالية:
مثال على ملف |
عليك تزويد Google بالمسارات التي تؤدي إلى أدلة حزمة الإنتاج وحزمة تطوير البرامج (Sandbox)
ملف أضف حساب الخدمة الذي يقدمه مستشار Google كقارئ لحسابك في Google حزمة Cloud Storage لمزيد من المعلومات عن كيفية التحكُّم في وصول خدمة Google Cloud Storage (GCS)، يُرجى الاطّلاع على تقويم وحدة تحكّم Cloud Platform: ضبط أذونات الحزمة يجب أن تتضمّن حزمة GCS المعلومات التالية:
مثال على ملف |
يُرجى تقديم المعلومات التالية إلى Google:
|
كيف يعرف محرّك بحث Google الملفات التي يجب جلبها؟ | قائمة الدليل بكل الملفات في الحزمة | قائمة الدليل بكل الملفات في الحزمة | عناوين URL الفردية للملفات المدرَجة في خريطة الموقع |
كيف يعرف محرّك بحث Google أنّ الملفات جاهزة للجلب؟ | بعد الانتهاء من إنشاء خلاصات البيانات، عدِّل ملف marker.txt .
مع أحدث طابع زمني. |
بعد الانتهاء من إنشاء خلاصات البيانات، عدِّل ملف marker.txt .
مع أحدث طابع زمني. |
بعد الانتهاء من إنشاء خلاصات البيانات، عليك تعديل عنوان الاستجابة.
last-modified من sitemap.xml مع أحدث طابع زمني |
حدود الملفات |
الحد الأقصى لعدد الملفات: 100,000. يجب أن يكون لديك إجمالي أقل من 100,000 ملف في حزمة Amazon S3. |
الحد الأقصى لعدد الملفات: 100,000. يجب أن يكون إجمالي عدد الملفات في حزمة Google Cloud Storage أقل من 100,000 ملف. |
الحد الأقصى لعدد الملفات: 100,000. يجب أن يكون عدد مسارات الملفات ضمن ملف XML لخريطة الموقع أقل من 100,000. |
ربط خلاصات البيانات لنقل البيانات بشكل مجمّع
بعد استضافة خلاصاتك، عليك ربطها بمشروعك في مركز الإجراءات. تشير رسالة الأشكال البيانية يتم إجراء الضبط الأولي لخلاصات الإنتاج في صفحة مهام الإعداد. في وقت لاحق يمكن تعديل إعداد خلاصات الإنتاج وخلاصات وضع الحماية من صفحة الإعدادات > الخلاصات في أي وقت من خلال أي مستخدم بوابة لديه حساب الدور الإداري الخاص به. تُستخدم بيئة ساندبوكس لأغراض التطوير والاختبار، بينما فيتم عرض خلاصات الإنتاج للمستخدمين.
في حال استضافة خلاصات البيانات باستخدام Amazon S3
- في مركز الإجراءات، انتقِل إلى الإعدادات >. الخلاصات
-
انقر على تعديل واملأ نموذج تعديل الخلاصة:
- طريقة عرض الخلاصة: اضبط القيمة على Amazon S3.
- ملف العلامة: عليك تقديم عنوان URL لملف
marker.txt
. - ملفات البيانات: قدِّم عنوان URL إلى حزمة S3 التي تحتوي على خلاصات البيانات.
- رقم تعريف الوصول: أدخِل رقم تعريف مفتاح الوصول "إدارة الهوية وإمكانية الوصول" الذي يتضمّن أذونات القراءة من S3. الموارد.
- مفتاح الوصول: أدخِل مفتاح الوصول السري لإدارة الهوية وإمكانية الوصول (IAM) الذي يتضمّن أذونات القراءة من S3. الموارد.
- انقر على إرسال.
- وبعد مرور ساعة أو ساعتَين، تحقَّق مما إذا كانت عملية نقل البيانات المجمّعة ستجلب ملفات الخلاصة.
إذا كنت تستضيف خلاصات بياناتك باستخدام Google Cloud Storage
- في مركز الإجراءات، انتقِل إلى الإعدادات >. الخلاصات
-
انقر على تعديل واملأ نموذج تعديل الخلاصة:
- طريقة تسليم الخلاصة: اضبط القيمة على Google Cloud Storage.
- ملف العلامة: عليك تقديم عنوان URL لملف
marker.txt
. - ملفات البيانات: قدِّم عنوان URL إلى حزمة GCS التي تحتوي على خلاصات البيانات.
- انقر على إرسال.
- يتم إنشاء حساب خدمة للوصول إلى حزمة GCS. يمكن العثور على اسم الحساب في الإعداد > الخلاصات بعد مهام الإعداد كاملة. يجب أن يكون لحساب الخدمة هذا دور "قارئ العناصر القديمة في التخزين". يمكن لهذا الدور أن يتم منحها إلى حساب الخدمة في صفحة "إدارة الهوية وإمكانية الوصول" على وحدة تحكُّم Google Cloud
- وبعد مرور ساعة أو ساعتَين، تحقَّق مما إذا كانت عملية نقل البيانات المجمّعة ستجلب ملفات الخلاصة.
في حال استضافة خلاصات بياناتك باستخدام بروتوكول HTTPS
- في مركز الإجراءات، انتقِل إلى الإعدادات >. الخلاصات
-
انقر على تعديل واملأ نموذج تعديل الخلاصة:
- طريقة عرض الخلاصة: اضبطها على HTTPS.
- ملف خريطة الموقع: قدِّم عنوان URL لملف
sitemap.xml
. - اسم المستخدم: أدخِل بيانات اعتماد اسم المستخدم للوصول إلى خادم HTTPS.
- كلمة المرور: أدخِل كلمة المرور للوصول إلى خادم HTTPS.
- انقر على إرسال.
- وبعد مرور ساعة أو ساعتَين، تحقَّق مما إذا كانت عملية نقل البيانات المجمّعة ستجلب ملفات الخلاصة.
أمثلة على المسارات
يتضمّن الجدول التالي أمثلة على المسارات لكلّ خيار من خيارات الاستضافة:
Amazon S3 | Google Cloud Storage | HTTPS مع خريطة موقع | |
---|---|---|---|
المسار | s3://foorestaurant-google-feed-sandbox/ |
gs://foorestaurant-google-feed-sandbox/ |
https://sandbox-foorestaurant.com/sitemap.xml |
ملف العلامة | s3://foorestaurant-google-feed-sandbox/marker.txt |
gs://foorestaurant-google-feed-sandbox/marker.txt |
غير منطبق |
ملفات خرائط الموقع لاستضافة HTTPS
يُرجى اتّباع الإرشادات التالية عند تحديد خرائط الموقع:
- يجب أن تشير الروابط في خريطة الموقع إلى الملفات نفسها.
- إذا كان ملف خريطة الموقع يتضمن مراجع إلى مزود السحابة
بدلاً من اسم نطاقك،
تأكَّد من أنّ بداية عناوين URL، مثل
https://www.yourcloudprovider.com/your_id
، مستقرة وفريدة لوظيفتك المجمّعة. - احرص على عدم تحميل خرائط موقع جزئية (مثلاً في حالة تحميل بيانات جزئي). التنفيذ يؤدي ذلك إلى استيعاب Google للملفات فقط في خريطة الموقع، ما يؤدي إلى تدخُّل المساحة المتوفّرة من المستويات إلى انخفاض، ما قد يؤدي إلى حظر عرض الخلاصة.
- تأكَّد من أنّ المسارات إلى الملفات المشار إليها في خريطة الموقع لا تتغيّر. على سبيل المثال، لا ينبغي
جعل ملف خريطة الموقع مرجع
https://www.yourcloudprovider.com/your_id/10000.json
اليوم ولكن بعد ذلك يشير إلىhttps://www.yourcloudprovider.com/your_id/20000.json
غدًا.
مثال على ملف خريطة الموقع
في ما يلي مثال على ملف sitemap.xml
يعرض ملفات خلاصة البيانات:
المثال 1: الكيانات التي يجمّعها التجّار (يُنصح بها).
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
المثال 2: كيانات مجمّعة حسب الأنواع.
XML
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://your_fulfillment_url.com/restaurant.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/menu.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> <url> <loc>https://your_fulfillment_url.com/service.json</loc> <lastmod>2018-06-11T10:46:43+05:30</lastmod> </url> </urlset>
تعديل خلاصات البيانات
بعد ربط خلاصات البيانات، تبحث Google عن التحديثات مرة كل ساعة، إلا أنّنا ننقل إليها.
كل خلاصات البيانات بعد حذف ملفات marker.txt
أو sitemap.xml
تم تعديله. نتوقع تعديل خلاصات البيانات مرة واحدة في اليوم لتجنُّب توفّر المستودع القديم.
للإشارة إلى أنّه تم تعديل خلاصات البيانات وأنّها جاهزة للعرض المجمَّع، يجب تعديل
حقل البيانات الوصفية للعنصر last-modified
في ملف marker.txt
(لبرنامج GCP و
S3) أو عنوان الاستجابة last-modified
للملف sitemap.xml
. Google
هذه القيم لتحديد مدى حداثة خلاصة البيانات.
أثناء نقل بيانات الخلاصة المجمّعة،
- الكيانات الجديدة غير الموجودة في المخزون الشامل الحالي للطلب وليس لها أي فسيتم إدراج الأخطاء.
-
الكيانات المتوفّرة حاليًا في المستودع ولا تتضمّن أي أخطاء في
وأن يكون لديها إما
dateModified
أحدث من الإدخال الحالي أو في حال عدم وجودdateModified
وقت بدء نقل الخلاصة أحدث من الإدخال الحالي الذي قد يتم محدثة، وإلا فسيتم وضع علامة عليها كقديمة. - الكيانات التي كانت جزءًا من خلاصة سابقة ولم تعُد مضمّنة في سيتمّ حذف الخلاصة المجمّعة التي تتمّ معالجتها، شرط ألا يتوفّر ملف. على مستوى الخلاصة.
يجب تعديل الطابع الزمني أو عنوان الاستجابة last-modified
فقط بعد إضافة جميع البيانات.
ملفات الخلاصة وتحديثها. الحدّ من تنفيذ المهام المجمّعة التي تعدِّل خلاصات البيانات
مرة واحدة في اليوم. بدلاً من ذلك، يمكنك ترك فاصل زمني لا يقل عن ثلاث ساعات بين كل مهمة مجمعة. إذا لم تحدد
اتخاذ هذه الخطوات، قد يجلب محرك بحث Google ملفات قديمة.