Feedfetcher

يشكّل برنامج Feedfetcher الوسيلة التي يستخدمها محرّك بحث Google للزحف إلى خلاصات RSS أو Atom على أخبار Google وPubSubHubbub. ويخزّن Feedfetcher الخلاصات التي يطلبها مستخدمو تطبيق أو خدمة ما ويعيد تحميلها بشكل دوري. تتم فقط فهرسة خلاصات البودكاست في "بحث Google"، ولكن قد تتم فهرسة خلاصة حتى إذا لم تتّبِع مواصفات Atom أو RSS. في ما يلي بعض الإجابات عن أكثر الأسئلة الشائعة حول طريقة عمل برنامج التقاط الخلاصات التي يتحكّم فيها المستخدمون.

كيف يمكنني أن أطلب ألا يستردّ محرّك بحث Google بعض أو جميع خلاصات موقعي الإلكتروني؟

عندما يضيف المستخدمون خدمة أو تطبيقًا يستخدمان بيانات Feedfetcher، يحاول Feedfetcher من Google الحصول على محتوى الخلاصة ليعرضه. وبما أنّ طلبات Feedfetcher تنتج عن الإجراءات الصريحة التي يجريها المستخدمون وليس عن برامج الزحف الآلية، فإنّ Feedfetcher لا يتّبِع قواعد ملف robots.txt.

إذا كانت خلاصتك متوفّرة علنًا، لا يمكن لمحرّك بحث Google حظر المستخدمين من الدخول إليها. لحلّ هذه المشكلة، يمكنك ضبط موقعك الإلكتروني لعرض رسالة حالة الخطأ 404 أو 410 أو غيرهما لوكيل المستخدم Feedfetcher-Google.

إذا كانت خلاصتك متوفّرة من خلال خدمة استضافة مدونة أو موقع إلكتروني، يمكنك التواصل مباشرةً مع هذه الخدمة لحظر الدخول إلى خلاصتك.

ما هو معدّل استرداد Feedfetcher لخلاصاتي؟

في العادة، لا يسترِد برنامج Feedfetcher الخلاصات من أغلب المواقع أكثر من مرّة واحدة كل ساعة في المتوسط. وقد تتم إعادة التحميل بعدد مرات أكبر لبعض المواقع الإلكترونية التي يتكرّر تعديلها. يُرجى العلم بأنّه نظرًا لحالات تأخير الشبكات، يمكن أن يبدو Feedfetcher لفترة قصيرة وكأنّه يسترد خلاصاتك بمعدّل أعلى.

لماذا يحاول Feedfetcher تنزيل روابط غير صحيحة من خادمي أو من نطاق غير موجود؟

يحاول Feedfetcher استرداد الخلاصات بطلب من الخدمات أو التطبيقات التي ثبّتها المستخدم. ومن المحتمَل أن يكون أحد المستخدمين قد طلب استرداد عنوان URL للخلاصة غير متوفّر.

لماذا ينزّل Feedfetcher المعلومات من خادم الويب "السري"؟

يحاول Feedfetcher استرداد الخلاصات بطلب من الخدمات أو التطبيقات التي ثبّتها المستخدم. من المحتمَل أن يكون المستخدم الذي أرسل الطلب على علم بالخادم "السري" لديك أو ربما يكون قد كتبه عن طريق الخطأ.

لماذا لا يتّبع Feedfetcher التعليمات في ملف robots.txt؟

لا يسترد Feedfetcher الخلاصات إلا بعد أن يشغّل المستخدمون بشكل صريح خدمةً أو تطبيقًا ما يطلب بيانات من الخلاصة. يعمل Feedfetcher كوكيل مباشر للمستخدم، وليس كبرنامج روبوت، وبالتالي يتجاهل إدخالات ملف robots.txt. وبما أنّ Feedfetcher يعمل كوكيل لعدّة مستخدمين، فإنّه يحفظ معدّل نقل البيانات من خلال إنشاء طلبات للخلاصات الشائعة مرّة واحدة فقط لجميع المستخدمين الذين طلبوا الخلاصة من خلال تطبيق أو خدمة. الخلاصتان الشائعتان هما RSS وAtom.

يمكنك منع Feedfetcher من الزحف إلى موقعك الإلكتروني من خلال ضبط خادمك لعرض رسالة حالة الخطأ 404 أو 410 أو غيرهما لوكيل المستخدم Feedfetcher-Google.

لماذا هناك زيارات من أجهزة متعددة على Google.com، جميعها باستخدام وكيل المستخدم Feedfetcher؟

تم تصميم Feedfetcher ليتم توزيعه على أجهزة متعدّدة من أجل تحسين الأداء وتطويره مع نمو الويب. لخفض استهلاك معدّل نقل البيانات، يتم غالبًا وضع الأجهزة في مكان قريب من المواقع الإلكترونية التي تجلب منها البيانات في الشبكة.

هل يمكنني التعرّف على عناوين IP التي ينشئ Feedfetcher الطلبات من خلالها، لأتمكن من فلترة سجلّاتي؟

يتم تضمين عناوين IP التي يستخدمها Feedfetcher في الكائن user-triggered-fetchers-google.json.

لماذا ينزّل Feedfetcher الصفحة نفسها على موقعي الإلكتروني عدة مرات؟

بوجه عام، لا ينزّل Feedfetcher إلا نسخة واحدة من كل ملف من موقعك الإلكتروني أثناء عملية استرداد خلاصة معيَّنة. في حالات نادرة، يتم إيقاف الأجهزة وإعادة تشغيلها، ما قد يؤدي إلى استرداد الصفحات التي تم الانتقال إليها مؤخرًا مرة أخرى.

ما أنواع الروابط التي يزحف إليها Feedfetcher؟

على عكس برامج زحف الويب العادية، لا يستكشف Feedfetcher الروابط إطلاقًا، بل يزحف إلى عنوان URL واحد يقدّمه إليه مستخدمو الخدمة أو التطبيق اللذين يستعينان ببيانات Feedfetcher.

لم تتم الإجابة عن سؤالي حول Feedfetcher هنا. أين يمكنني الحصول على مزيد من المساعدة؟

إذا استمرت المشكلة، يمكنك نشر سؤالك في منتدى "مجموعة خدمات بحث Google".