Google Search के काम करने का तरीका

Google कैसे काम करता है? यहां खास बातों के साथ-साथ, पूरी जानकारी भी दी गई है.

Google को कई स्रोतों से जानकारी मिलती है, जैसे:

  • वेब पेज,
  • Google My Business और Maps जैसे प्रॉडक्ट का इस्तेमाल करने वाले लोगों की ओर से दी गई जानकारी,
  • स्कैन हुई किताबें
  • इंटरनेट पर उपलब्ध सार्वजनिक डेटाबेस,
  • और कई दूसरे स्रोत

हालांकि, इस पेज पर सिर्फ़ वेब पेजों से मिलने वाली जानकारी दी गई है.

मुख्य बातें

वेब पेजों से नतीजे दिखाने के लिए Google तीन बुनियादी तरीके अपनाता है:

क्रॉल करना

सबसे पहले पता लगाया जाता है कि वेब पर किस तरह के पेज मौजूद हैं. सभी वेब पेजों के लिए कोई एक रजिस्ट्री नहीं है, इसलिए Google को लगातार नए पेज ढूंढता है. साथ ही, उन्हें ऐसे पेजों की सूची में जोड़ता रहता है जिनकी जानकारी Google को पहले से होती है. Google को कुछ पेजों की जानकारी होती है, क्योंकि वह पहले ही उनको क्रॉल कर चुका है. जब Google को क्रॉल किए जा चुके किसी पेज से नए पेज का लिंक मिलता है, तब उसे दूसरे पेजों का पता चलता है. कुछ पेज तब मिलते हैं, जब वेबसाइट का मालिक पेजों को क्रॉल करने के लिए, उनकी सूची (साइटमैप) Google को सबमिट करता है. अगर आप Wix या Blogger जैसे किसी मैनेज वेब होस्ट का इस्तेमाल कर रहे हैं, तो ये कंपनियां आपके अपडेट किए गए पेजों या नए पेजों को क्रॉल करने के लिए, Google को जानकारी भेज सकती हैं.

जब Google को किसी पेज का यूआरएल मिलता है, तो वह उस पर जाता है या उसे क्रॉल करता है, ताकि पता चल सके कि पेज पर क्या है. Google पेज को रेंडर करता है और उस पर मौजूद टेक्स्ट और बिना टेक्स्ट वाले कॉन्टेंट के अलावा, पेज के पूरे विज़ुअल लेआउट का भी विश्लेषण करता है. इससे, वह तय करता है कि खोज के नतीजों में पेज कहां दिखना चाहिए. Google आपकी साइट को जितना बेहतर तरीके से जानेगा, हम उतनी ही आसानी से आपके कॉन्टेंट को, उसे ढूंढ रहे लोगों तक पहुंचा सकेंगे.

अपनी साइट की बेहतर क्रॉलिंग के लिए:

  • पक्का करें कि Google आपकी साइट के पेजों तक पहुंच सके और वे सही दिखते हों. Google, वेब को एक ऐसे उपयोगकर्ता के तौर पर ऐक्सेस करता है जिसके पास पासवर्ड या कोई जानकारी नहीं है. पेज की सही जानकारी पाने के लिए, Google को सभी इमेज और दूसरे एलिमेंट ठीक से दिखने चाहिए. आप मोबाइल फ़्रेंडली जांच टूल में अपने पेज का यूआरएल टाइप करके, जल्दी से जांच कर सकते हैं.
  • अगर आपने कोई पेज बनाया या अपडेट किया है, तो आप उसका यूआरएल अलग से Google को सबमिट कर सकते हैं. Google को एक साथ, कई नए या अपडेट किए गए पेजों के बारे में बताने के लिए, साइटमैप का इस्तेमाल करें
  • अगर आप चाहते हैं कि Google आपकी साइट के सिर्फ़ एक पेज को क्रॉल करे, तो वह पेज आपका होम पेज होना चाहिए. Google के हिसाब से, होम पेज आपकी साइट का सबसे अहम पेज होता है. अगर आप चाहते हैं कि आपकी साइट को अच्छी तरह क्रॉल किया जाए, तो ध्यान रखें कि आपके होम पेज और सभी पेजों पर अच्छा साइट नेविगेशन सिस्टम होना चाहिए, जो आपकी साइट के अहम पेजों और सेक्शन को लिंक करता हो. इससे, उपयोगकर्ताओं और Google को आपकी साइट पर एक जगह से दूसरी जगह पर जाने में आसानी होती है. 1,000 से कम पेजों वाली छोटी साइटों के लिए, Google को यह जानकारी दें कि आपके होम पेज पर ही सभी ज़रूरी चीज़ें हैं. इससे, Google आपके होम पेज से शुरू होने वाले लिंक के पाथ फ़ॉलो करता हुआ आपके दूसरे सभी पेजों पर पहुंच सकता है.
  • अपने पेज को किसी ऐसे पेज से लिंक करें जिसे Google पहले ही क्रॉल कर चुका है. हालांकि, इस बात का ध्यान रखें कि विज्ञापन में दिए गए लिंक, दूसरी साइटों पर पैसे देकर दिखाए गए लिंक या टिप्पणियों में दिए गए लिंक क्रॉल नहीं किए जाते. साथ ही, Google ऐसे लिंक भी क्रॉल नहीं करता जो Google वेबमास्टर गाइडलाइंस के हिसाब से सही नहीं होते.
Google, किसी साइट को ज़्यादा बार क्रॉल करने या उसे खोज नतीजों में ऊपर दिखाने के लिए पैसे नहीं लेता है. अगर कोई व्यक्ति आपको बताता है कि Google ऐसा करने के लिए पैसे लेता है, तो वह गलत बोल रहा है.

इंडेक्स करना

पेज का पता लगने के बाद, Google यह समझने की कोशिश करता है कि पेज किस बारे में है. इस प्रक्रिया को इंडेक्स करना कहते हैं. Google, पेज के कॉन्टेंट का विश्लेषण करता है, पेज पर एम्बेड की गई इमेज और वीडियो फ़ाइलों को अपनी लाइब्रेरी में सेव करता है, और दूसरे तरीकों से पेज को समझने की कोशिश करता है. यह जानकारी Google इंडेक्स में सेव की जाती है. यह ऐसा डेटाबेस है जो बहुत सारे कंप्यूटर में स्टोर होता है.

इंडेक्स होने के लिए अपने पेज को बेहतर बनाने के लिए:

  • पेज के ऐसे शीर्षक बनाएं, जो छोटे हों और उपयोगकर्ता को आसानी से समझ में आ जाएं.
  • पेज के बारे में बताने के लिए पेज की हेडिंग इस्तेमाल करें.
  • कॉन्टेंट के बारे में बताने के लिए इमेज के बजाय टेक्स्ट का इस्तेमाल करें. Google कुछ इमेज और वीडियो को समझ सकता है, लेकिन उन्हें उतनी अच्छी तरह से नहीं समझ पाता जितनी अच्छी तरह से टेक्स्ट को समझता है. इसलिए, कम से कम अपने वीडियो और इमेज के ऊपर टेक्स्ट, लिंक वगैरह जैसी व्याख्याएं जोड़ें. ज़रूरत के मुताबिक, आपको ऐसे एट्रिब्यूट जोड़ने चाहिए.

पेज दिखाना और उन्हें रैंक करना

जब किसी उपयोगकर्ता की क्वेरी आती है, तब Google अपने इंडेक्स से सबसे सटीक नतीजे ढूंढने की कोशिश करता है. इसके लिए Google कई बातें ध्यान में रखता है. Google सबसे अच्छी क्वालिटी वाले नतीजे दिखाने की कोशिश करता है. ऐसा करने के लिए, वह उपयोगकर्ता के अनुभव को बेहतर बनाने वाली बातें ध्यान में रखता है. Google उपयोगकर्ता की जगह की जानकारी, भाषा, और डिवाइस (डेस्कटॉप या फ़ोन) जैसी दूसरी जानकारी को ध्यान में रखकर सटीक नतीजे दिखाता है. उदाहरण के लिए, अगर भारत में कोई उपयोगकर्ता इंटरनेट पर "साइकल की मरम्मत करने वाली दुकान" के बारे में खोजता है और बांग्लादेश में भी कोई उपयोगकर्ता इंटरनेट पर यही खोज करता है, तो दोनों को अलग-अलग खोज नतीजे दिखेंगे. Google किसी पेज की रैंक बढ़ाने के लिए पैसा नहीं लेता. पेज की रैंकिंग, प्रोग्राम के ज़रिए तय की जाती है.

खोज नतीजों में पेज को बेहतर तरीके से दिखाने और उसकी रैंकिंग बेहतर करने के लिए:

पूरी जानकारी

क्या आप इस बारे में ज़्यादा जानकारी पाना चाहते हैं? यहां इस बारे में ज़्यादा जानकारी दी गई है:

पूरी जानकारी

क्रॉल करना

क्रॉल करना ऐसी प्रक्रिया है जिसकी मदद से Googlebot, Google इंडेक्स में जोड़े जाने वाले नए और अपडेट किए गए पेजों पर जाता है.

हम वेब पर अरबों पेज लाने (या "क्रॉल करने") के लिए बहुत सारे कंप्यूटर इस्तेमाल करते हैं. पेज ढूंढने वाले इस प्रोग्राम को Googlebot कहते हैं. इसे रोबोट, बॉट या स्पाइडर के नाम से भी जाना जाता है. Googlebot, एल्गोरिदम प्रोसेस इस्तेमाल करके तय करता है कि किस साइट को क्रॉल करना है, उसे कितनी बार क्रॉल करना है, और हर साइट से कितने पेज क्रॉल करने हैं.

Google की क्रॉल करने की प्रक्रिया, वेब पेज के यूआरएल की सूची बनाने से शुरू होती है. यह सूची, क्रॉल करने की पिछली प्रक्रियाओं और वेबसाइट के मालिकों से मिले साइटमैप के डेटा की मदद से तैयार की जाती है. जब Googlebot किसी पेज पर जाता है, तो वहां उसे लिंक मिलते हैं. Googlebot इन लिंक को उन पेजों की सूची में जोड़ देता है जिन्हें क्रॉल किया जाना है. नई साइटें, मौजूदा साइटों में किए गए बदलाव, और इस्तेमाल में न आने वाले लिंक नोट किए जाते हैं और उन्हें Google इंडेक्स को अपडेट करने के लिए इस्तेमाल किया जाता है.

क्रॉल करते समय Google, पेज को रेंडर करने के लिए, Chrome के सबसे नए वर्शन का इस्तेमाल करता है. रेंडरिंग करते समय Google, उन सभी पेज स्क्रिप्ट को क्रॉल करता है जो उसे मिलते हैं. अगर आपकी साइट, डाइनैमिक तरीके से जनरेट किया गया कॉन्टेंट इस्तेमाल करती है, तो पक्का करें कि आप JavaScript SEO की बुनियादी बातों को फ़ॉलो करते हैं.

प्राइमरी क्रॉल / सेकेंडरी क्रॉल

वेबसाइट को क्रॉल करने के लिए, Google दो अलग-अलग क्रॉलर इस्तेमाल करता है: मोबाइल क्रॉलर और डेस्कटॉप क्रॉलर. हर तरह का क्रॉलर, उसी तरह के डिवाइस के हिसाब से काम करता है जिससे उपयोगकर्ता आपके पेज पर आता है.

Google आपकी साइट के लिए, प्राइमरी क्रॉलर के रूप में किसी एक तरह का (मोबाइल या डेस्कटॉप) क्रॉलर इस्तेमाल करता है. Google आपकी साइट के सभी पेजों को, प्राइमरी क्रॉलर का इस्तेमाल करके क्रॉल करता है. सभी नई वेबसाइटों के लिए, मोबाइल क्रॉलर ही प्राइमरी क्रॉलर के रूप में काम करता है.

इसके अलावा, Google आपकी साइट पर कुछ पेजों को दूसरी तरह के क्रॉलर (मोबाइल या डेस्कटॉप) इस्तेमाल करके, फिर से क्रॉल करता है. इसे सेकेंडरी क्रॉल कहा जाता है. इसे यह देखने के लिए किया जाता है कि आपकी साइट, दूसरी तरह के डिवाइस के साथ कितना अच्छा काम करती है.

Google को कैसे पता चलता है कि किन पेजों को क्रॉल नहीं करना है?

  • robots.txt के ज़रिए ब्लॉक किए गए पेजों को क्रॉल नहीं किया जाता, लेकिन अगर किसी दूसरे पेज पर उनका लिंक मिलता है, तो उन्हें इंडेक्स किया जा सकता है. Google, लिंक के ज़रिए यह अंदाज़ा लगा सकता है कि पेज पर किस तरह का कॉन्टेंट है और बिना पार्स किए ही उसे इंडेक्स कर सकता है.
  • Google किसी ऐसे पेज को क्रॉल नहीं कर सकता जिसे कोई ऐसा उपयोगकर्ता ऐक्सेस न कर पाए जिसके पास कोई ईमेल आईडी या ऐक्सेस करने की मंज़ूरी नहीं है. इसलिए, ऐसे किसी पेज को क्रॉल नहीं किया जाता जिसे ऐक्सेस करने के लिए लॉग इन करने या सुरक्षा से जुड़ी किसी मंज़ूरी की ज़रूरत हो.
  • जिन पेजों को पहले ही क्रॉल किया जा चुका है और माना जाता है कि वे दूसरे पेज के डुप्लीकेट हैं उन्हें ज़्यादा बार क्रॉल नहीं किया जाता.

क्रॉल कराने के लिए, अपनी साइट को बेहतर बनाना

इन तकनीकों का इस्तेमाल करके, अपनी साइट पर सही पेज ढूंढने में Google की मदद करें:

इंडेक्स करना

पेज के कॉन्टेंट को समझने के लिए, Googlebot क्रॉल किए गए सभी पेजों को प्रोसेस करता है. इसमें टेक्स्ट कॉन्टेंट को प्रोसेस करना, मुख्य कॉन्टेंट टैग, और एट्रिब्यूट शामिल हैं, जैसे कि <title> टैग और ऑल्ट एट्रिब्यूट के साथ इमेज और वीडियो के अलावा काफ़ी कुछ. Googlebot कई तरह के कॉन्टेंट को प्रोसेस कर सकता है, लेकिन सभी तरह के कॉन्टेंट को नहीं. उदाहरण के लिए, हम रिच मीडिया वाली कुछ फ़ाइलों का कॉन्टेंट प्रोसेस नहीं करते.

क्रॉल और इंडेक्स करते समय Google को यह पता चल जाता है कि कोई पेज, दूसरे पेज का डुप्लीकेट या कैननिकल है या नहीं. अगर पेज को डुप्लीकेट माना जाता है, तो उसे कम बार क्रॉल किया जाएगा. किसी डॉक्यूमेंट में एक जैसे पेजों का ग्रुप बनाया जाता है. यह एक या इससे ज़्यादा पेजों का ऐसा ग्रुप होता है जिसमें कैननिकल पेज (ग्रुप का सबसे अहम प्रतिनिधि) और पाए गए डुप्लीकेट पेज (जो उसी पेज तक जाने के लिए वैकल्पिक यूआरएल या उसी पेज का मोबाइल या डेस्कटॉप वर्शन भी हो सकता है) भी शामिल होते हैं.

ध्यान दें कि Google noindex डायरेक्टिव (हेडर या टैग) वाले पेजों को इंडेक्स नहीं करता. अगर किसी पेज को robots.txt फ़ाइल, लॉगिन पेज या दूसरे डिवाइस से ब्लॉक किया गया है, तो Google को इसके बारे में निर्देश दिखना चाहिए. हो सकता है कि Google उस पेज को भी इंडेक्स कर ले जिस पर वह कभी न गया हो!

इंडेक्स करवाने के लिए अपने पेज को बेहतर बनाना

आप नीचे दी गई तकनीकों का इस्तेमाल करके, अपने पेज के कॉन्टेंट को बेहतर तरीके से समझने में, Google की मदद कर सकते हैं:

"दस्तावेज़" क्या होता है?

अंदरूनी रूप से, Google, वेब को डॉक्यूमेंट के बहुत बड़े सेट के तौर पर दिखाता है. हर डॉक्यूमेंट, एक या ज़्यादा वेब पेज दिखाता है. ये पेज एक जैसे या मिलते-जुलते होते हैं, लेकिन इनमें कॉन्टेंट एक जैसा ही होता है, जिस पर अलग-अलग यूआरएल से पहुंचा जा सकता है. किसी डॉक्यूमेंट के अलग-अलग यूआरएल एक ही पेज पर ले जा सकते हैं. उदाहरण के लिए, example.com/dresses/summer/1234 और example.com?product=1234 एक ही पेज दिखा सकते हैं या फिर अलग-अलग डिवाइस के उपयोगकर्ताओं के हिसाब से थोड़े वैरिएशन के साथ, उसी पेज पर भी ले जा सकते हैं. उदाहरण के लिए, डेस्कटॉप उपयोगकर्ताओं के लिए example.com/mypage और मोबाइल उपयोगकर्ताओं के लिए m.example.com/mypage, दोनों एक ही पेज पर ले जा सकते हैं.

Google, किसी डॉक्यूमेंट में से कोई यूआरएल चुनता है और उसे डॉक्यूमेंट के कैननिकल यूआरएल के रूप में बताता है. डॉक्यूमेंट का कैननिकल यूआरएल, वह यूआरएल होता है जिसे Google सबसे ज़्यादा क्रॉल और इंडेक्स करता है. दूसरे यूआरएल डुप्लीकेट या वैकल्पिक माने जाते हैं. उन्हें उपयोगकर्ता के अनुरोध के हिसाब से, समय-समय पर क्रॉल किया जा सकता है: उदाहरण के लिए, अगर किसी डॉक्यूमेंट का कैननिकल यूआरएल, एक मोबाइल यूआरएल है, लेकिन हो सकता है कि Google, डेस्कटॉप पर खोजने वाले उपयोगकर्ताओं के लिए डेस्कटॉप (वैकल्पिक) यूआरएल ही दिखाए.

Search Console में ज़्यादातर रिपोर्ट, दस्तावेज़ के कैननिकल यूआरएल के डेटा से तैयार की जाती हैं. कुछ टूल (जैसे कि यूआरएल जांचने वाला टूल), वैकल्पिक यूआरएल की जांच करने की सुविधा देते हैं. हालांकि, कैननिकल यूआरएल की जांच करने पर ही वैकल्पिक यूआरएल के बारे में भी जानकारी मिल जानी चाहिए.

आप Google को बता सकते हैं कि आप किस यूआरएल को कैननिकल बनाना चाहते हैं, लेकिन Google कोई और कैननिकल यूआरएल चुन सकता है. इसकी कई वजहें हो सकती हैं.

यहां शब्दों के बारे में खास जानकारी दी गई है और उन्हें Search Console में इस्तेमाल करने का तरीका बताया गया है:

  • डॉक्यूमेंट: मिलते-जुलते पेजों का संग्रह. इसमें कैननिकल यूआरएल होता है और अगर आपकी साइट में डुप्लीकेट पेज हैं, तो अन्य यूआरएल हो सकते हैं. डॉक्यूमेंट में यूआरएल समान या दूसरे संगठन (रूट डोमेन, उदाहरण के लिए www.google.com में "google") से हो सकते हैं. Google, प्लैटफ़ॉर्म (मोबाइल/डेस्कटॉप), उपयोगकर्ता की भाषा या जगह, और कई दूसरे वैरिएबल के हिसाब से, खोज के नतीजों में दिखाने के लिए सबसे अच्छा यूआरएल चुनता है. Google, ऑर्गैनिक क्रॉलिंग या साइट में लागू की गई रीडायरेक्ट या <link rel=alternate/canonical> टैग जैसी सुविधाओं के ज़रिए, मिलते-जुलते पेजों को खोजता है. दूसरे डोमेन के मिलते-जुलते पेजों को तब ही वैकल्पिक के तौर पर मार्क किया जा सकता है, जब उन्हें साफ़ तौर पर आपकी साइट के ज़रिए (रीडायरेक्ट या लिंक टैग की मदद से) कोड किया गया हो.
  • यूआरएल: किसी साइट पर कॉन्टेंट के दिए गए हिस्से तक पहुंचने के लिए, यूआरएल इस्तेमाल किया जाता है. साइट के एक ही पेज पर, अलग-अलग यूआरएल इस्तेमाल करके भी पहुंचा जा सकता है.
  • पेज: किसी वेब पेज पर, एक या ज़्यादा यूआरएल से पहुंचा जा सकता है. ऐसे में, उपयोगकर्ता के प्लैटफ़ॉर्म (मोबाइल, डेस्कटॉप, टैबलेट वगैरह) के हिसाब से, पेज के अलग-अलग वर्शन हो सकते हैं.
  • वर्शन: पेज का एक वर्शन "मोबाइल," "डेस्कटॉप," और "एएमपी" हो सकता है. हालांकि, एएमपी के भी मोबाइल और डेस्कटॉप वर्शन हो सकते हैं. हर वर्शन का यूआरएल अलग-अलग (example.com बनाम m.example.com) या एक जैसा हो सकता है. यह साइट के कॉन्फ़िगरेशन के हिसाब से होता है. अगर आपकी साइट डाइनैमिक सर्विंग या रिस्पॉन्सिव वेब डिज़ाइन इस्तेमाल करती है, तो वही यूआरएल एक ही पेज के अलग-अलग वर्शन दिखा सकता है. भाषा के वैरिएशन, अलग वर्शन नहीं माने जाते, लेकिन अलग डॉक्यूमेंट माने जाते हैं.
  • कैननिकल पेज या यूआरएल: वह यूआरएल जिसे Google, डॉक्यूमेंट का सबसे सही प्रतिनिधि मानता है. Google हमेशा इस यूआरएल को क्रॉल करता है; डॉक्यूमेंट के डुप्लीकेट यूआरएल भी कभी-कभी क्रॉल किए जाते हैं.
  • वैकल्पिक/डुप्लीकेट पेज या यूआरएल:डॉक्यूमेंट का वह यूआरएल जिसे Google कभी-कभी क्रॉल कर सकता है. अगर ये यूआरएल, उपयोगकर्ता और उसके अनुरोध के हिसाब से सही हैं, तो Google इन्हें भी दिखाता है. उदाहरण के लिए, डेस्कटॉप उपयोगकर्ताओं के अनुरोध पर, कैननिकल मोबाइल यूआरएल के बजाय, डेस्कटॉप के लिए बना वैकल्पिक यूआरएल ही भेजा जाएगा.
  • साइट: आम तौर पर इसे वेबसाइट (सैद्धांतिक रूप से मिलते-जुलते वेब पेजों का सेट) के एक समानार्थी के रूप में इस्तेमाल किया जाता है, लेकिन कभी-कभी इसे Search Console की प्रॉपर्टी के समानार्थी के रूप में भी इस्तेमाल किया जाता है. हालांकि, किसी प्रॉपर्टी को सिर्फ़ साइट के एक हिस्से के तौर पर ही बताया जा सकता है. अगर साइट के पास, ठीक से लिंक किए गए एएमपी पेज हों, तो वह सबडोमेन और यहां तक कि डोमेन भी स्पैन कर सकती है.

अलग-अलग भाषाओं में एक जैसे कॉन्टेंट वाले पेज, ऐसे अलग-अलग डॉक्यूमेंट में सेव किए जाते हैं जो hreflang टैग इस्तेमाल करके एक-दूसरे के बारे में बताते हैं. इसलिए, अनुवाद किए गए कॉन्टेंट के लिए hreflang टैग इस्तेमाल करना बेहद अहम है.

नतीजे दिखाना

जब कोई उपयोगकर्ता क्वेरी डालता है, तो हमारी मशीनें इंडेक्स में, मिलते-जुलते पेजों को खोजती हैं और उन परिणामों को दिखाती हैं जिन्हें हम उपयोगकर्ता के लिए सबसे ज़्यादा काम का मानते हैं. क्वेरी से मिलते-जुलते नतीजे ढूंढते समय, सैकड़ों चीजों को ध्यान में रखा जाता है. हम हमेशा अपने एल्गोरिदम को बेहतर बनाने के लिए काम करते रहते हैं. नतीजे चुनने और उन्हें दिखाने का क्रम तय करने के लिए, Google, उपयोगकर्ता अनुभव को ध्यान में रखता है. इसलिए, पक्का करें कि आपका पेज तेज़ी से लोड होता हो और मोबाइल-फ़्रेंडली हो.

नतीजों में दिखने के लिए, अपने पेज को बेहतर बनाने का तरीका

और ज़्यादा जानकारी

आप यहां, Google Search के काम करने के तरीके के बारे में ज़्यादा जानकारी पा सकते हैं. यहां इस बारे में तस्वीरों और वीडियो की मदद से बताया गया है!