Feedfetcher
يشكّل برنامج Feedfetcher الوسيلة التي يستخدمها محرّك بحث Google للزحف إلى خلاصات RSS أو Atom على أخبار Google وPubSubHubbub. ويحفظ Feedfetcher الخلاصات التي يطلبها مستخدمو تطبيق أو خدمة ما ويعيد تحميلها بشكل دوري. تتمّ فقط فهرسة خلاصات البودكاست في "بحث Google"، ولكن قد تتم فهرسة خلاصة حتى إذا لم تتّبِع مواصفات Atom أو RSS. في ما يلي بعض الإجابات عن أكثر الأسئلة الشائعة حول طريقة عمل برنامج التقاط الخلاصات التي يتحكّم فيها المستخدمون.
كيف يمكنني أن أطلب ألا يسترد محرّك بحث Google بعض أو جميع خلاصات موقعي الإلكتروني؟
عندما يضيف المستخدمون خدمة أو تطبيقًا يستخدمان بيانات Feedfetcher، يحاول Feedfetcher من Google الحصول على محتوى الخلاصة ليعرضه. وبما أنّ طلبات Feedfetcher تنتج عن الإجراءات الصريحة التي يجريها المستخدمون وليس عن برامج الزحف الآلية، فإنّ Feedfetcher لا يتّبِع قواعد ملف robots.txt.
إذا كانت خلاصتك متوفّرة علنًا، لا يمكن لمحرّك بحث Google حظر المستخدمين من الدخول إليها. ولحلّ هذه المشكلة، يمكنك ضبط موقعك الإلكتروني لعرض رسالة حالة الخطأ 404
أو 410
أو غيرهما لوكيل المستخدم Feedfetcher-Google
.
إذا كانت خلاصتك متوفّرة من خلال خدمة استضافة مدونة أو موقع إلكتروني، يمكنك التواصل مباشرةً مع هذه الخدمة لحظر الدخول إلى خلاصتك.
ما هو معدّل استرداد Feedfetcher لخلاصاتي؟
في العادة، لا يسترِد برنامج Feedfetcher الخلاصات من أغلب المواقع الإلكترونية أكثر من مرّة واحدة كل ساعة في المتوسط. وقد تتم إعادة التحميل بعدد مرات أكبر لبعض المواقع الإلكترونية التي يتكرّر تعديلها. يُرجى العلم بأنّه نظرًا لحالات تأخير الشبكات، يمكن أن يبدو Feedfetcher لفترة قصيرة وكأنه يسترد خلاصاتك بمعدّل أعلى.
لماذا يحاول Feedfetcher تنزيل روابط غير صحيحة من خادمي أو من نطاق غير موجود؟
يحاول Feedfetcher استرداد الخلاصات بطلب من الخدمات أو التطبيقات التي ثبّتها المستخدم. ومن المحتمَل أن يكون أحد المستخدمين قد طلب استرداد عنوان URL للخلاصة غير متوفّر.
لماذا ينزّل Feedfetcher المعلومات من خادم الويب "السري"؟
يحاول Feedfetcher استرداد الخلاصات بطلب من الخدمات أو التطبيقات التي ثبّتها المستخدم. من المحتمَل أن يكون المستخدم الذي أرسل الطلب على علم بالخادم "السري" لديك أو ربما يكون قد كتبه عن طريق الخطأ.
لماذا لا يتّبع Feedfetcher التعليمات في ملف robots.txt؟
لا يسترد Feedfetcher الخلاصات إلا بعد أن يشغّل المستخدمون بشكل صريح خدمةً أو تطبيقًا ما يطلب بيانات من الخلاصة. يعمل Feedfetcher كوكيل مباشر للمستخدم، وليس كبرنامج روبوت، وبالتالي يتجاهل إدخالات ملف robots.txt. وبما أنّ Feedfetcher يعمل كوكيل لعدّة مستخدمين، فإنه يحفظ معدّل نقل البيانات من خلال إنشاء طلبات للخلاصات الشائعة مرّة واحدة فقط لجميع المستخدمين الذين طلبوا الخلاصة من خلال تطبيق أو خدمة. الخلاصتان الشائعتان هما RSS وAtom.
يمكنك منع Feedfetcher من الزحف إلى موقعك الإلكتروني من خلال ضبط خادمك لعرض رسالة حالة الخطأ 404
أو 410
أو غيرهما لوكيل المستخدم Feedfetcher-Google
.
لماذا هناك زيارات من أجهزة متعددة على Google.com، جميعها باستخدام وكيل المستخدم Feedfetcher؟
تم تصميم Feedfetcher ليتم توزيعه على أجهزة متعدّدة لتحسين الأداء وتطويره مع نمو الويب. لخفض استهلاك معدّل نقل البيانات، يتم غالبًا وضع الأجهزة في مكان قريب من المواقع الإلكترونية التي تجلب منها البيانات في الشبكة.
هل يمكنني التعرّف على عناوين IP التي ينشئ Feedfetcher الطلبات من خلالها، لأتمكن من فلترة سجلّاتي؟
يتم تضمين عناوين IP التي يستخدمها Feedfetcher في الكائن user-triggered-fetchers-google.json.
لماذا ينزّل Feedfetcher الصفحة نفسها على موقعي الإلكتروني عدة مرات؟
بوجه عام، لا ينزّل Feedfetcher إلا نسخة واحدة من كل ملف من موقعك الإلكتروني أثناء عملية استرداد خلاصة معيَّنة. في حالات نادرة، يتم إيقاف الأجهزة وإعادة تشغيلها، ما قد يؤدي إلى استرداد الصفحات التي تم الانتقال إليها مؤخرًا مرة أخرى.
ما أنواع الروابط التي يتابعها Feedfetcher؟
على العكس من برامج زحف الويب العادية، لا يتّبِع Feedfetcher الروابط إطلاقًا، ولكنه بدلاً من ذلك يتّبِع الطلبات التي يقدّمها إليه مستخدمو الخدمة أو التطبيق الذي يستفيد من Feedfetcher.
لم تتم الإجابة عن سؤالي حول Feedfetcher هنا. أين يمكنني الحصول على مزيد من المساعدة؟
إذا استمرت المشكلة، يمكنك نشر سؤالك في منتدى "مجموعة خدمات بحث Google".