دليل مفصّل حول آلية عمل "بحث Google‏"

"بحث Google‏" هو محرّك بحث مبرمَج بشكل كامل يستخدم برامج تُعرف باسم برامج الزحف لاستكشاف الويب بشكل منتظم والعثور على الصفحات لإضافتها إلى فهرسنا. وفي الواقع، إنّ الغالبية العظمى من الصفحات المضمّنة في نتائجنا ليست مقدّمة يدويًا بل تم العثور عليها وإضافتها تلقائيًا عند زحف برامجنا إلى الويب. يشرح هذا المستند المراحل التي تشملها آلية عمل "بحث Google‏" في سياق عمل موقعك الإلكتروني. وقد تساعدك هذه المعلومات الأساسية في حلّ المشاكل المتعلقة بالزحف وتهيئة صفحاتك لتتم فهرستها والتعرّف على كيفية تحسين ظهور موقعك الإلكتروني في "بحث Google‏".

إليك بعض الملاحظات قبل البدء

قبل التعمّق في تفاصيل آلية عمل "بحث Google‏"، نذكّر أنّ Google لا تقبل تلقّي دفعات مالية مقابل زيادة عدد مرات زحف محرّك بحثها إلى موقع إلكتروني أو منح الموقع الإلكتروني ترتيبًا أفضل في نتائج البحث. وأي معلومات تناقض ذلك هي غير صحيحة.

لا يضمن محرّك بحث Google إمكانية الزحف إلى صفحتك وفهرستها وعرضها، حتى إذا كانت الصفحة تتّبع أساسيات "بحث Google".

ينقسم عمل محرّك بحث Google إلى ثلاث مراحل، وبعض الصفحات لا تنجح في اجتياز كل مرحلة:

  1. الزحف: ينزّل محرّك بحث Google النص والصور والفيديوهات من الصفحات التي يعثر عليها على الإنترنت باستخدام برامج مبرمَجة تُعرف باسم برامج الزحف.
  2. الفهرسة: يحلّل محرّك بحث Google النص والصور وملفات الفيديو المضمَّنة على الصفحة ويحفظ المعلومات في فهرس Google، وهو قاعدة بيانات ضخمة.
  3. عرض نتائج البحث: عندما يجري المستخدم عملية بحث على Google، يعرض محرّك البحث معلومات ذات صلة بطلب بحث المستخدم.

الزحف

المرحلة الأولى هي اكتشاف الصفحات المنشورة على الويب. ليس هناك سجلّ مركزي يضم جميع صفحات الويب، لذا على محرّك بحث Google أن يبحث باستمرار عن الصفحات الجديدة والمُعدّلة وأن يضيفها إلى قائمة الصفحات المعروفة لديه. تُعرف هذه العملية باسم "اكتشاف عناوين URL". تكون بعض الصفحات معروفة، لأنّ محرّك بحث Google قد سبق أن زارها. يكتشف محرّك بحث Google صفحات أخرى عندما يتتبّع رابطًا مضمّنًا في صفحة معروفة ويؤدي إلى صفحة جديدة، على سبيل المثال، تؤدّي صفحة المركز، مثل صفحة الفئة إلى مشاركة مدونة جديدة. وهناك صفحات أخرى يكتشفها محرّك بحث Google عندما ترسل أنت قائمة صفحات (خريطة الموقع) التي تريد أن يزحف إليها محرّك البحث.

عندما يكتشف محرّك بحث Google عنوان URL الخاص بصفحة، قد يزور (أو "يزحف إلى") الصفحة لاكتشاف المحتوى المضمَّن فيها. نحن نستخدم مجموعة ضخمة من أجهزة الكمبيوتر للزحف إلى المليارات من الصفحات على الويب. ويُعرف البرنامج الذي يجلب الصفحات باسم Googlebot (وهو معروف أيضًا باسم برنامج روبوت أو برنامج تتبّع أو برنامج عنكبوت). يستخدم Googlebot عملية تعتمد على الخوارزميات لتحديد المواقع الإلكترونية التي يزحف إليها وعدد مرات الزحف وعدد الصفحات التي يجلبها من كل موقع إلكتروني. تتم برمجة برامج زحف Google أيضًا بحيث تحاول عدم الزحف إلى الموقع الإلكتروني بشكل سريع جدًا لتجنُّب تحميله عبئًا زائدًا. وتستند هذه الآلية إلى استجابات الموقع الإلكتروني (على سبيل المثال، تعني أخطاء HTTP 500 ضرورة "تخفيض معدّل الزحف") والإعدادات في Search Console.

ومع ذلك، لا يزحف Googlebot إلى جميع الصفحات التي يكتشفها. قد يحظر مالك الموقع الإلكتروني إمكانية الزحف إلى بعض الصفحات، بينما تكون صفحات أخرى متاحة بدون تسجيل الدخول إلى الموقع الإلكتروني أو نُسخًا مكررة من صفحات سبق أن تم الزحف إليها. على سبيل المثال، يمكن الوصول إلى الكثير من المواقع الإلكترونية من خلال إصدار اسم النطاق المزوّد بالبادئة www (www.example.com) والإصدار غير المزوّد بها (example.com)، حتى إذا كان المحتوى مماثلاً في الإصدارَين.

خلال عملية الزحف، يعرض محرّك بحث Google الصفحة ويشغّل أي محتوى JavaScript يتم العثور إليه باستخدام إصدار حديث من Chrome، بالطريقة نفسها التي يتّبعها متصفحك لعرض الصفحات التي تزورها. تُعدّ عملية العرض مهمة لأنّ المواقع الإلكترونية غالبًا ما تعتمد على JavaScript لجلب المحتوى إلى الصفحة، وفي غياب عملية العرض، قد لا يكتشف محرّك بحث Google ذلك المحتوى.

تعتمد عملية الزحف على ما إذا كان بإمكان برامج زحف Google الوصول إلى الموقع الإلكتروني. وتشمل بعض المشاكل الشائعة التي تتعلّق بإمكانية وصول Googlebot إلى المواقع الإلكترونية ما يلي:

الفهرسة

بعد أن يتم الزحف إلى الصفحة، يحاول محرّك بحث Google فهم مضمونها. تُعرف هذه المرحلة بالفهرسة وتشمل معالجة وتحليل المحتوى النصي والعلامات والسمات الرئيسية للمحتوى، مثل عناصر <title> وسمات النص البديل والصور والفيديوهات وغير ذلك.

خلال عملية الفهرسة، يحدّد محرّك بحث Google ما إذا كانت الصفحة نسخة مكررة من صفحة أخرى على الإنترنت أو صفحة أساسية. الصفحة الأساسية هي الصفحة التي قد يتم عرضها في نتائج البحث. لاختيار الصفحة الأساسية، نجمّع أولاً الصفحات التي نعثر عليها على الإنترنت والتي تتضمن محتوًى مماثلاً، ثم نختار الصفحة التي نعتقد أنّها الأكثر تمثيلاً في المجموعة. وتكون الصفحات الأخرى في المجموعة إصدارات بديلة قد يتم عرضها في سياقات مختلفة، إذا كان المستخدم يجري عملية البحث من جهاز جوّال مثلاً أو يبحث عن صفحة معيّنة من هذه المجموعة.

يجمع محرّك بحث Google أيضًا إشارات عن الصفحة الأساسية والمحتوى المضمَّن عليها والذي يمكن استخدامه في المرحلة التالية، حين نعرض الصفحة في نتائج البحث. وتشمل بعض الإشارات لغة الصفحة والبلد المصدر للمحتوى وسهولة استخدام الصفحة وما إلى ذلك.

قد يتم حفظ المعلومات التي يتم جمعها عن الصفحة الأساسية ومجموعة الصفحات المشابهة لها في فهرس Google، وهو قاعدة بيانات ضخمة مستضافة على الآلاف من أجهزة الكمبيوتر. لا يضمن محرّك بحث Google أن تتم فهرسة كل الصفحات التي تتم معالجتها.

تعتمد عملية الفهرسة أيضًا على محتوى الصفحة والبيانات الوصفية الخاصة بها. ويمكن أن تشمل بعض المشاكل الشائعة للفهرسة ما يلي:

عرض نتائج البحث

عندما يجري المستخدم عملية بحث، تبحث محرّكاتنا في الفهرس عن الصفحات المطابقة وتعرض له النتائج التي نعتبرها الأعلى جودة والأكثر صلةً بموضوع البحث. ويتم تحديد مدى الصلة بموضوع البحث استنادًا إلى المئات من العوامل، التي قد تشمل معلومات مثل موقع المستخدم الجغرافي ولغته والجهاز الذي يستخدمه (كمبيوتر مكتبي أو هاتف). على سبيل المثال، عند البحث عن "محلات إصلاح الدرّاجات"، ستختلف النتائج التي تظهر لمستخدم مقيم في دبي عن النتائج التي تظهر لمستخدم مقيم في بيروت.

يمكن أن تُبيّن لك خدمة Search Console أنّ الصفحة قد تمت فهرستها، ولكنها لا تظهر في نتائج البحث. قد يعود السبب في ذلك إلى أحد الأسباب التالية:

علمًا أنّ هذا الدليل يشرح آلية عمل &quot;بحث Google‏&quot;، فنحن نعمل باستمرار على تحسين خوارزمياتنا. ويمكنك تتبّع هذه التغييرات من خلال متابعة مدونة مجموعة خدمات بحث Google.