العرض على دفعات

تتيح لك خلاصات البيانات إتاحة مطعمك وخدماتك وقائمة الطعام في قسم الطلب الشامل.

يتناول هذا المستند كيفية استضافة مستودع وضع الحماية والإنتاج واستخدام العرض المجمّع لتعديل المستودع من خلال الترتيب التام بين الأطراف.

بيئات خلاصة البيانات

تتوفّر ثلاث بيئات لخلاصات البيانات من أجل تطوير عملية الدمج:

بيئة الخلاصة الوصف العرض على دفعات
وضع الحماية بيئة الاختبار لتطوير الخلاصة. حقل مطلوب
الإنتاج بيئة الإنتاج لمستودعك الذي تريد إطلاقه. حقل مطلوب

استضافة خلاصات البيانات

لكي يتمكّن الطلب الشامل من معالجة خلاصات بيانات الإنتاج ووضع الحماية عن طريق العرض المجمّع، يجب استضافة ملفات خلاصة البيانات في Google Cloud Storage أو Amazon S3 أو HTTPS باستخدام خريطة موقع.

ننصح باستضافة خلاصات البيانات لبيئات وضع الحماية والإنتاج بشكل منفصل. يتيح لك هذا الأسلوب إجراء تطوير واختبار في بيئة خلاصة وضع الحماية قبل نشر التغييرات في مرحلة الإنتاج.

على سبيل المثال، إذا كنت تستخدم Google Cloud Storage كخيار استضافة، ستظهر لك المسارات التالية:

  • خلاصة وضع الحماية: gs://foorestaurant-google-feed-sandbox/
  • خلاصة الإنتاج: "gs://foorestaurant-google-feed-prod/"

لاستضافة المستودع، يُرجى اتّباع الخطوات التالية:

  1. إنشاء ملفات خلاصة البيانات
  2. اختَر حل استضافة.
  3. استضافة خلاصات البيانات
  4. يُرجى الحرص على تعديل ملفات خلاصة البيانات بانتظام. يجب تعديل خلاصات بيانات الإنتاج يوميًا.

للحصول على تفاصيل حول كيفية إنشاء خلاصة مستودع، اطّلِع على مستندات كيانات Restaurant وService وMenu، بالإضافة إلى قسم إنشاء خلاصة بيانات.

إرشادات حول ملفات خلاصة البيانات

يجب ألا يتجاوز كل ملف، يمكن أن يحتوي على كيانات متعددة، 200 ميغابايت. يجب ألا تتجاوز الكيانات ذات المستوى الأعلى Restaurant وService وMenu بالإضافة إلى الكيانات الفرعية التابعة لها 4 ميغابايت.

اختيار حل استضافة

يعرض الجدول التالي خيارات استضافة خلاصات البيانات وكيفية عمل هذه المضيفين من خلال الترتيب التام بين الأطراف:

Amazon S3 Google Cloud Storage HTTPS مع خريطة موقع
بيانات الاعتماد وإمكانية الوصول

عليك تزويد Google بالمعلومات التالية:

  • رقم تعريف مفتاح الوصول
  • مفتاح الوصول السري
  • المسارات المؤدية إلى أدلة الإنتاج ووضع الحماية S3 وملف marker.txt. يجب أن يبدأ المسار بـ s3://.

يجب أن تتضمن حزمة S3 المعلومات التالية:

  • ملفات الخلاصة لمستودعك
  • marker.txt، الذي يحتوي على طابع زمني مستخدَم للجلب.

مثال على ملف من marker.txt: 2018-12-03T08:30:42.694Z

قدِّم لشركة Google المسارات المؤدية إلى أدلة مجموعات بيانات الإنتاج وحِزم الحماية وملف marker.txt. يجب أن تبدأ المسارات بـ gs://.

أضِف حساب الخدمة الذي قدّمه مستشار Google كقارئ لحزمة Google Cloud Storage.

لمزيد من المعلومات حول طريقة التحكّم في الوصول إلى Google Cloud Storage (GCS)، يُرجى الاطّلاع على مقالة Google Cloud Platform Console: ضبط أذونات الحزمة.

يجب أن تتضمّن حزمة GCS المعلومات التالية:

  • ملفات الخلاصة لمستودعك
  • marker.txt، الذي يحتوي على طابع زمني مستخدَم للجلب.

مثال على ملف من marker.txt: 2018-12-03T08:30:42.694Z

عليك تزويد Google بالمعلومات التالية:

  • بيانات اعتماد المصادقة الأساسية
  • المسار إلى مسار ملف sitemap الإنتاج ووضع الحماية يجب أن يبدأ المسار بـ https://.
  • البروتوكول: يجب إتاحة ملفات الخلاصة عبر بروتوكول HTTPS وليس عبر بروتوكول HTTP.
  • الأمان: تنصح Google بشدّة بحماية ملفات الخلاصة المستضافة باستخدام المصادقة الأساسية.
كيفية معرفة Google للملفات التي يجب جلبها قائمة الدليل لجميع الملفات في الحزمة. قائمة الدليل لجميع الملفات في الحزمة. عناوين URL فردية للملفات المدرَجة في خريطة الموقع
كيفية معرفة Google بأنّ الملفات جاهزة للجلب بعد الانتهاء من إنشاء خلاصات البيانات، يجب تعديل ملف marker.txt باستخدام أحدث طابع زمني. بعد الانتهاء من إنشاء خلاصات البيانات، يجب تعديل ملف marker.txt باستخدام أحدث طابع زمني. بعد الانتهاء من إنشاء خلاصات البيانات، عدِّل عنوان الاستجابة last-modified من sitemap.xml باستخدام أحدث طابع زمني.
حدود الملفات

الحد الأقصى لعدد الملفات: 100,000 ملف.

يجب أن يكون لديك أقل من 100,000 ملف إجمالاً في حزمة Amazon S3.

الحد الأقصى لعدد الملفات: 100,000 ملف.

يجب أن يكون لديك إجمالي أقل من 100,000 ملف في حزمة Google Cloud Storage.

الحد الأقصى لعدد الملفات: 100,000 ملف.

يجب أن يكون عدد مسارات الملفات ضمن ملف Sitemap بتنسيق XML أقل من 100,000.

ربط خلاصات البيانات للعرض المجمّع

بعد استضافة الخلاصات، عليك ربطها بمشروعك في مركز الإجراءات. ويتم الضبط الأولي لخلاصات الإنتاج في صفحة مهام الإعداد. في وقت لاحق، يمكن لأي مستخدم للبوابة لديه دور إداري تعديل إعدادات خلاصات الإنتاج ووضع الحماية من صفحة الإعدادات > الخلاصات في أي وقت. يتم استخدام بيئة وضع الحماية لأغراض التطوير والاختبار، بينما يتم عرض خلاصات الإنتاج للمستخدمين.

في حال استضافة خلاصات البيانات على Amazon S3

  1. في مركز الإجراءات، انتقِل إلى الضبط > الخلاصات.
  2. انقر على تعديل واملأ نموذج تعديل الخلاصة:

    • طريقة تسليم الخلاصة: اضبط القيمة على Amazon S3.
    • ملف العلامة: أدخِل عنوان URL لملف marker.txt.
    • ملفات البيانات: قدِّم عنوان URL إلى حزمة S3 التي تحتوي على خلاصات البيانات.
    • رقم تعريف الوصول: أدخِل رقم تعريف مفتاح الوصول لإدارة الهوية وإمكانية الوصول (IAM) مع أذونات للقراءة من موارد S3.
    • مفتاح الوصول: أدخِل مفتاح الوصول السري لإدارة الهوية وإمكانية الوصول (IAM) مع أذونات للقراءة من موارد S3.
  3. انقر على إرسال.
  4. بعد مرور ساعة أو ساعتَين، تحقّق مما إذا كان العرض المجمّع يجلب ملفات الخلاصة.

في حال استضافة خلاصات البيانات باستخدام Google Cloud Storage

  1. في مركز الإجراءات، انتقِل إلى الضبط > الخلاصات.
  2. انقر على تعديل واملأ نموذج تعديل الخلاصة:

    • طريقة تسليم الخلاصة: اضبطها على Google Cloud Storage.
    • ملف العلامة: أدخِل عنوان URL لملف marker.txt.
    • ملفات البيانات: أدخِل عنوان URL إلى حزمة GCS التي تحتوي على خلاصات البيانات.
  3. انقر على إرسال.
  4. يتم إنشاء حساب خدمة للوصول إلى حزمة GCS. يمكن العثور على اسم الحساب في الإعدادات > الخلاصات بعد اكتمال مهام الإعداد. يحتاج حساب الخدمة هذا إلى دور "قارئ العناصر القديمة للتخزين". يمكن منح هذا الدور لحساب الخدمة في صفحة "إدارة الهوية وإمكانية الوصول" ضمن Google Cloud Console.
  5. بعد مرور ساعة أو ساعتَين، تحقّق مما إذا كان العرض المجمّع يجلب ملفات الخلاصة.

في حال استضافة خلاصات البيانات باستخدام HTTPS

  1. في مركز الإجراءات، انتقِل إلى الضبط > الخلاصات.
  2. انقر على تعديل واملأ نموذج تعديل الخلاصة:

    • طريقة تسليم الخلاصة: اضبط القيمة على HTTPS.
    • ملف Sitemap: أدخِل عنوان URL لملف sitemap.xml.
    • اسم المستخدم: أدخِل بيانات اعتماد اسم المستخدم للوصول إلى خادم HTTPS.
    • كلمة المرور: أدخِل كلمة المرور للدخول إلى خادم HTTPS.
  3. انقر على إرسال.
  4. بعد مرور ساعة أو ساعتَين، تحقّق مما إذا كان العرض المجمّع يجلب ملفات الخلاصة.

أمثلة على المسارات

يحتوي الجدول التالي على أمثلة على المسارات لكل خيار من خيارات الاستضافة:

Amazon S3 Google Cloud Storage HTTPS مع خريطة موقع
المسار s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
ملف العلامة s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt غير منطبق

ملفات Sitemap لاستضافة HTTPS

اتّبِع الإرشادات التالية عند تحديد ملفات Sitemap:

  • يجب أن تشير الروابط في خريطة الموقع إلى الملفات نفسها.
  • إذا كانت خريطة الموقع تتضمّن مراجع لمقدّم خدمات السحابة الإلكترونية بدلاً من اسم النطاق الخاص بك، تأكَّد من أنّ بداية عناوين URL، مثل https://www.yourcloudprovider.com/your_id، ثابتة وفريدة للمهمة المجمّعة.
  • احرص على عدم تحميل ملفات Sitemap جزئية (على سبيل المثال، في حال تحميل بيانات جزئية). ويؤدّي ذلك إلى نقل محرّك بحث Google للملفات في خريطة الموقع فقط، ما يؤدي إلى انخفاض مستويات المستودع وقد يؤدي إلى حظر عرض الخلاصة.
  • تأكّد من عدم تغيُّر المسارات إلى الملفات المُشار إليها في خريطة الموقع. على سبيل المثال، لا تُضِف مرجع ملف Sitemap إلى https://www.yourcloudprovider.com/your_id/10000.json اليوم، ثم أشِر إلى https://www.yourcloudprovider.com/your_id/20000.json غدًا.
مثال على ملف Sitemap لفيديو

في ما يلي مثال على ملف sitemap.xml يعرض ملفات خلاصة البيانات:

المثال 1: الكيانات المجمّعة حسب التجار (مقترَح)

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

المثال 2: تم تجميع الكيانات حسب الأنواع.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

تعديل خلاصات البيانات

بعد ربط خلاصات البيانات، يبحث محرّك بحث Google عن أي تعديلات مرة واحدة كل ساعة، ولكنّنا لا ننقل جميع خلاصات البيانات إلا عند تعديل ملفَي marker.txt أو sitemap.xml. نتوقّع تعديل خلاصات البيانات مرة واحدة في اليوم لتجنّب عرض المستودع القديم.

لتحديد أنّه تم تعديل خلاصات البيانات وأصبحت جاهزة للعرض على دفعات، عليك تعديل حقل البيانات الوصفية للعنصر last-modified في ملف marker.txt (لكل من Google Cloud Platform وS3) أو عنوان الاستجابة last-modified لملف sitemap.xml. ويستخدم محرّك بحث Google هذه القيم لتحديد مدى حداثة خلاصة البيانات.

وأثناء نقل الخلاصة المجمّعة،

  • سيتم إدراج الكيانات الجديدة التي لا تتوفّر في المستودع الحالي الخاص بنظام الطلب النهائي ولا تتضمّن أي أخطاء.
  • الكيانات المتوفّرة حاليًا في المستودع ولا تتضمّن أي أخطاء في العرض والتي تحتوي على dateModified أحدث من الإدخال الحالي أو في حال عدم توفّر dateModified، يكون وقت بدء عرض الخلاصة أحدث من الإدخال الحالي الذي سيتم تعديله، وإلا سيتم وضع علامة عليها على أنّها قديمة.
  • سيتم حذف الكيانات التي كانت جزءًا من خلاصة سابقة لم تعُد مضمّنة في الخلاصة المجمّعة التي تتم معالجتها، شرط ألا تتضمّن الخلاصة أي أخطاء على مستوى الملف.

يجب عدم تعديل الطابع الزمني أو عنوان الاستجابة last-modified إلا بعد إنشاء جميع ملفات خلاصة البيانات وتعديلها. الحدّ من المهام المجمّعة التي تعدِّل خلاصات البيانات بحيث يتم تشغيلها مرة واحدة في اليوم فقط. بدلاً من ذلك، يكون هناك فجوة تبلغ ثلاث ساعات على الأقل بين كل مهمة مجمَّعة. إذا لم تتخذ هذه الخطوات، قد يجلب محرّك بحث Google الملفات القديمة.