الثلاثاء 3 ديسمبر 2024
من المعروف أنّ محرّك بحث Google يحتاج إلى تنفيذ بعض الخطوات قبل أن تظهر صفحة ويب ضمن نتائج البحث على Google. وإحدى هذه الخطوات تُسمّى الزحف. يزحف محرّك بحث Google إلى الويب باستخدام Googlebot، وهو برنامج يتم تشغيله على خوادم Google، ومهمته استرداد عناوين URL والتعامل مع بعض التعقيدات الصغيرة التي قد تواجهه أثناء الزحف، مثل الأخطاء في الشبكة وعمليات إعادة التوجيه وغيرها. مع ذلك، هناك بعض التفاصيل التي لا يتم الحديث عنها كثيرًا. خلال هذا الشهر، سنستكشف معًا كل أسبوع بعض هذه التفاصيل، إذ إنّها قد تؤثر بشكل ملحوظ في طريقة الزحف إلى مواقعكم الإلكترونية.
تذكير سريع: ما هو الزحف؟
تشمل عملية الزحف اكتشاف صفحات الويب الجديدة، وزيارتها مرة أخرى عند تحديثها، وتنزيلها. باختصار، بعد أن يتلقى Googlebot عنوان URL، يرسل طلب HTTP إلى الخادم الذي يستضيف العنوان ثم يتعامل مع استجابة الخادم، وقد يشمل ذلك اتّباع عمليات إعادة التوجيه ومعالجة الأخطاء ونقل محتوى الصفحة إلى نظام الفهرسة في Google.
ندرك أنّ محتوى صفحات الويب الحديثة لا يقتصر على HTML، فماذا إذًا عن الموارد الأخرى التي تتكوّن منها الصفحة؟ وكيف تتأثّر "ميزانية الزحف" بعملية الزحف إلى تلك الموارد؟ هل هذه الموارد قابلة للتخزين المؤقّت من جهة Google؟ وهل هناك فرق بين عناوين URL التي لم يسبق الزحف إليها والعناوين المفهرسة؟ في هذا المنشور، سنجيب عن هذه الأسئلة، والمزيد.
Googlebot والزحف إلى موارد الصفحات
بالإضافة إلى HTML، تستخدم المواقع الإلكترونية الحديثة مجموعة من التكنولوجيات المختلفة، مثل JavaScript وCSS، لتوفير تجارب حيوية ووظائف مفيدة للمستخدمين. عند الدخول إلى هكذا صفحات باستخدام المتصفّح، ينزّل المتصفّح أولاً عنوان URL الرئيسي الذي يستضيف البيانات اللازمة لبدء تركيب الصفحة للمستخدمين، أي محتوى HTML الخاص بالصفحة. قد تتضمّن هذه البيانات الأولية إشارات إلى موارد، مثل JavaScript وCSS، بالإضافة إلى الصور والفيديوهات التي سينزّلها المتصفّح مجددًا لتركيب الصفحة النهائية التي ستُعرض بعد ذلك للمستخدمين.
ينفّذ محرّك بحث Google الخطوات نفسها مع بعض الاختلافات البسيطة:
- ينزّل Googlebot البيانات الأولية، أي محتوى HTML الخاص بالصفحة، من عنوان URL الرئيسي.
- ينقل Googlebot البيانات التي جلبها إلى "خدمة العرض على الويب" (WRS).
- باستخدام Googlebot، تنزّل خدمة WRS الموارد التي تمت الإشارة إليها في البيانات الأصلية.
- تركّب خدمة WRS الصفحة باستخدام جميع الموارد التي تم تنزيلها، تمامًا كما يفعل المتصفّح.
قد يستغرق الانتقال من خطوة إلى أخرى وقتًا أطول مقارنةً بالمتصفّح بسبب قيود مرتبطة بالجدولة، مثل زيادة الحِمل على الخادم الذي يستضيف الموارد اللازمة لعرض الصفحة. وهنا يأتي دور الحديث عن ميزانية الزحف.
إنّ الزحف إلى الموارد اللازمة لعرض الصفحة سيؤدي إلى تناقُص ميزانية الزحف المخصّصة لاسم المضيف الذي يستضيف الموارد. للحدّ من هذا التناقص، تحاول خدمة WRS أن تخزِّن بشكل مؤقت كل مورد (JavaScript وCSS) تمت الإشارة إليه في الصفحة التي تعرضها. ولا تتأثر مدة بقاء ذاكرة التخزين المؤقت لخدمة WRS بتوجيهات تخزين HTTP، بل تخزّن خدمة WRS كل الموارد لمدة تصل إلى 30 يومًا، ما يساهم في الحفاظ على ميزانية الزحف الخاصة بالموقع الإلكتروني والاستفادة منها في مهام زحف أخرى.
من منظور مالكي المواقع الإلكترونية، يمكن أن تتأثر ميزانية الزحف الخاصة بالموقع الإلكتروني بالموارد التي يتم الزحف إليها وطريقة الزحف، وبالتالي ننصح بما يلي:
- استخدِموا أقل قدر ممكن من الموارد اللازمة لتقديم تجربة رائعة للمستخدمين، لأنّه كلما قلّ عدد الموارد المطلوبة لعرض الصفحة، انخفضت ميزانية الزحف التي يتم استهلاكها خلال العرض.
- استخدموا معلَمات تفعيل منظِّم ذاكرة التخزين المؤقت بحذر: إذا تغيّرت عناوين URL الخاصة بالموارد، قد يحتاج Google إلى إعادة الزحف إليها، حتى ولو لم يتغيّر محتواها. وهذا بالطبع سيؤدي إلى استهلاك ميزانية الزحف.
- استضيفوا الموارد على اسم مضيف مختلف عن الموقع الإلكتروني الرئيسي، مثلاً من خلال استخدام شبكة لتوصيل المحتوى (CDN) أو عن طريق استضافة الموارد على نطاق فرعي مختلف. سيؤدي ذلك إلى نقل المسائل المتعلقة بميزانية الزحف إلى المضيف الذي يعرض الموارد.
تنطبق جميع هذه النقاط على موارد الوسائط أيضًا. إذا جلب Googlebot (أو على وجه التحديد Googlebot-Image
وGooglebot-Video
) هذه الموارد، ستُستهلَك ميزانية الزحف الخاصة بالموقع الإلكتروني.
قد تميلون إلى إضافة ملف robots.txt إلى القائمة أيضًا، ولكن من منظور العرض، سيؤدي حظر الزحف إلى الموارد إلى حدوث مشاكل عادةً. إذا لم تتمكّن خدمة WRS من جلب أحد الموارد الضرورية للعرض، قد يواجه محرّك بحث Google مشكلة في استخراج محتوى الصفحة والسماح بحصولها على ترتيب في "بحث Google".
إلى أي موارد يزحف Googlebot؟
المصدر الأفضل لتحليل الموارد التي يزحف إليها محرّك بحث Google هو سجلّات الوصول الأصلية التي تتضمّن إدخالاً لكل عنوان URL تم طلبه من خلال المتصفحات وبرامج الزحف على حدّ سواء. للتعرّف على برامج زحف Google ضمن سجلّات الوصول، يمكنك الاطّلاع على نطاقات عناوين IP المنشورة في مستندات المطوّرين.
ثاني أفضل مصدر هو بالتأكيد "تقرير إحصاءات الزحف" في Search Console الذي يحدد بالتفصيل كل نوع موارد لكل برنامج زحف:

في الختام، إذا كنتم مهتمين بموضوعَي الزحف والعرض وتريدون الدردشة مع آخرين حول هذا الموضوع، ننصحكم بزيارة منتدى "مجموعة خدمات بحث Google"، ويمكنكم أيضًا التواصل معنا عبر LinkedIn.
التعديلات
- تعديل بتاريخ 6 ديسمبر 2024: أضفنا ملاحظة حول تأثّر الأداء عند عرض الموارد من مصدر مختلف.
هل يهمّك معرفة المزيد عن الزحف؟ ننصحك بالاطّلاع على سلسلة "الزحف في ديسمبر" بأكملها:
إضافة مقياس "مدى استجابة الصفحة لتفاعلات المستخدم" (INP) إلى Core Web Vitals
الأربعاء 10 مايو 2023 في أوائل العام 2020، طرح فريق Chrome لدى Google مؤشرات Core Web Vitals بهدف توفير مجموعة من إشارات الجودة المخصّصة لصفحات الويب. واليوم، أعلن فريق Google Chrome عن تغيير سنجريه على المقاييس الخاصة بمؤشرات Core Web Vitals يهدف
أهمية تجربة الصفحة في إنشاء محتوى مساعِد
الأربعاء 19 أبريل 2023 يوفّر المحتوى المساعِد بشكل عام تجربة صفحة جيدة. لذلك، أضفنا اليوم قسمًا حول تجربة الصفحة إلى دليل إنشاء المحتوى المساعِد ، كما راجعنا صفحة المساعدة الخاصة بتجربة الصفحات. وفقًا لرؤيتنا، فإنّ هذه الإجراءات ستساعد مالكي المواقع
المخطط الزمني لإتاحة ترتيب تجربة الصفحة على أجهزة الكمبيوتر المكتبي
الخميس 4 تشرين الثاني (نوفمبر) 2021 خلال مؤتمر I/O لعام 2021، قدّمنا لمحة مسبقة عن خططنا بإتاحة ترتيب تجربة الصفحة على أجهزة الكمبيوتر المكتبي. ونعلن اليوم عن المزيد من التفاصيل، بما في ذلك المخطط الزمني لهذه التغييرات. ويستند هذا الإجراء إلى التحديث
معلومات إضافية حول الأوقات والأدوات والتفاصيل المتعلّقة بالتحديث الخاص بتجربة الصفحة
الاثنين في 19 نيسان (أبريل) 2021 في شهر تشرين الثاني (نوفمبر) الماضي أعلنّا أنّه سيتم في العام الحالي تطبيق التغيير بخصوص ترتيب تجربة الصفحة على "بحث Google"، ضمن ما نطلق عليه اسم "التحديث الخاص بتجربة الصفحة". ولمساعدة الناشرين
موعد إدراج تجربة الصفحة في ترتيب نتائج "بحث Google"
الثلاثاء 10 تشرين الثاني (نوفمبر) 2020 أعلنّا في شهر أيار (مايو) الماضي أنّ إشارات تجربة الصفحة سيكون لها دور في ترتيب نتائج "بحث Google". وتقيس هذه الإشارات انطباع المستخدمين عن تجربة التفاعل مع صفحة ويب وتشكّل جزءًا من جهودنا المتواصلة في سبيل ضمان
تقييم تجربة الصفحة لتحسين تجربة الويب
الخميس في 28 مايو 2020 تُظهر الدراسات الداخلية و الأبحاث المتخصصّة ، أنّ المستخدمين يفضّلون المواقع الإلكترونية التي تقدّم تجربة صفحة رائعة. في السنوات الأخيرة، تمت إضافة مجموعة من معايير تجربة المستخدم في "بحث Google"، مثل سرعة
زيادة سرعة الموقع الإلكتروني باستخدام تقرير السرعة الجديد في Search Console
الاثنين 4 تشرين الثاني (نوفمبر) 2019 لطالما كانت تجربة الويب السريعة عاملاً مهمًا مؤثرًا في تجربة المستخدم، وقد شجّعنا دائمًا على توفيرها و شدّدنا على أهميتها. ولمساعدة مالكي المواقع الإلكترونية في هذا الشأن، عرضنا معاينة لتقرير السرعة في Search
تحسينات على تجربة المستخدم في أداة "سرعة الصفحة" ضمن بحث الجوّال
الخميس 4 نيسان (أبريل) 2019 لمساعدة المستخدمين في العثور على إجابات عن أسئلتهم بشكل أسرع، أضفنا سرعة الصفحة كعامل ترتيب لنتائج البحث على الأجهزة الجوّالة في عام 2018. ومنذ ذلك الحين، لاحظنا تحسّنًا في العديد من الصفحات على شبكة الإنترنت. إنّنا نسعى
"إحصاءات PageSpeed" المستندة إلى Lighthouse
الاثنين 12 نوفمبر 2018 ندرك في Google أهمية السرعة ، لذلك نقدّم مجموعة من الأدوات لمساعدة الجميع في فهم أداء الصفحة أو الموقع الإلكتروني. خلال مراحل زمنية مختلفة، استخدمت هذه الأدوات محركات تحليل مختلفة. وللأسف، تسبّب ذلك في بعض الالتباس، لأنّ
استخدام سرعة الصفحة في ترتيب نتائج بحث الجوّال
الأربعاء 17 كانون الثاني (يناير) 2018 يريد المستخدمون أن يتمكنوا من العثور على إجابات عن أسئلتهم بأسرع وقت ممكن، وتشير الدراسات إلى أنّ المستخدمين يهتمون جدًا بسرعة الصفحة. وعلىمًا أن سرعة الصفحة استُخدمت في الترتيب لبعض الوقت، كانت هذه الإشارة