डुप्लीकेट यूआरएल मिलाकर एक करना

अगर आपकी साइट पर कोई ऐसा पेज है जिसके कई यूआरएल हैं या एक जैसे कॉन्टेंट वाले कई पेज हैं (जैसे कि कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं), तो Google उन्हें एक ही पेज के डुप्लीकेट वर्शन मानता है. Google उस पेज के किसी एक यूआरएल काे कैननिकल वर्शन के तौर पर चुनकर उसे क्रॉल करेगा. बाकी सभी यूआरएल काे डुप्लीकेट यूआरएल मानकर उन्हें कभी-कभार ही क्रॉल किया जाएगा.

अगर आप साफ़ ताैर पर Google को यह नहीं बताएंगे कि किस यूआरएल को कैननिकल माना जाए, तो Google अपने हिसाब से एक कैननिकल यूआरएल चुन लेगा या दाेनाें ही यूआरएल काे बराबर मान लेगा. इससे आपके पेज, खोज नतीजों में ठीक से दिखाए जाएंगे. इस बारे में ज़्यादा जानकारी, नीचे दिए गए सेक्शन मुझे कैननिकल यूआरएल क्यों चुनना चाहिए? में माैजूद है.

कैननिकल यूआरएल क्या है?

कैननिकल यूआरएल उस पेज का यूआरएल होता है जिसे Google आपकी साइट पर मौजूद डुप्लीकेट पेजों में से सबसे ज़रूरी मानता है. उदाहरण के लिए, अगर आपके पास एक ही पेज के कई यूआरएल हैं (जैसे: example.com?dress=1234 और example.com/dresses/1234), तो Google इनमें से एक को कैननिकल यूआरएल के तौर पर चुन लेता है. ध्यान दें, यह ज़रूरी नहीं है कि पेज बिल्कुल एक जैसे हों; डुप्लीकेट पेजों पर कॉन्टेंट का क्रम बदलने या फ़िल्टर लगाने जैसे छोटे बदलाव करने पर (उदाहरण के लिए, कीमत के हिसाब से क्रम में लगाने या आइटम को रंग के हिसाब से फ़िल्टर करने पर) उन्हें अलग-अलग पेज के तौर पर नहीं गिना जाता है.

कैननिकल पेज किसी डुप्लीकेट पेज के बजाय दूसरे डोमेन से भी तय किया जा सकता है.

ज़्यादा जानकारी

किसी साइट को इंडेक्स करते समय, Googlebot उस साइट के हर पेज के मुख्य कॉन्टेंट का पता लगाने की कोशिश करता है. अगर Googlebot को एक ही साइट पर एक जैसे कई पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे सबसे ज़्यादा जानकारी देने वाला और काम का लगता है. इस पेज को कैननिकल पेज के तौर पर मार्क कर दिया जाता है. आपकी साइट के कैननिकल पेजों को नियमित रूप से क्रॉल किया जाएगा, जबकि डुप्लीकेट पेज कभी-कभार ही क्रॉल किए जाएंगे. इससे, आपकी साइट पर Google क्रॉलिंग के लोड को कम करने में मदद मिलती है.

Google कई चीज़ों (या सिग्नल) को ध्यान में रखकर कैननिकल पेज चुनता है. उदाहरण के लिए, पेज की क्वालिटी; साइटमैप में यूआरएल की मौजूदगी; पेज को एचटीटीपी के ज़रिए दिखाया जाता है या फिर एचटीटीपीएस के ज़रिए; और पेज पर कोई rel=canonical लेबल है या नहीं. आप इन तरीकों से Google को अपनी पसंद बता सकते हैं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं.

किसी पेज के अलग-अलग भाषाओं वाले वर्शन तभी डुप्लीकेट माने जाते हैं, जब पेज का मुख्य कॉन्टेंट एक ही भाषा में हो (इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गैर ज़रूरी टेक्स्ट का तो अनुवाद किया गया हो, लेकिन मुख्य लेख एक ही भाषा में मौजूद हो).

Google, कॉन्टेंट और क्वॉलिटी का आकलन करने के लिए कैननिकल पेजों का इस्तेमाल करता है. Google Search के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता के लिए कोई डुप्लीकेट पेज बेहतर हो, तो ऐसा नहीं होता है. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा हो, तो खोज नतीजों में शायद मोबाइल पेज ही दिखाया जाएगा. भले ही पेज के डेस्कटॉप वर्शन को कैननिकल पेज के तौर पर चुना गया हो.

मेरी साइट पर एक जैसे/डुप्लीकेट पेज होने की क्या वजह हो सकती है?

आपकी साइट पर एक ही पेज के अलग-अलग यूआरएल हो सकते हैं. साथ ही, अलग-अलग यूआरएल पर डुप्लीकेट या एक जैसे दिखने वाले पेज भी हो सकते हैं. इसकी सबसे आम वजहें यहां दी गई हैं:

  • कई तरह के डिवाइस पर काम करने के लिए:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • खोज पैरामीटर या सत्र आईडी जैसी चीज़ों के लिए डाइनैमिक यूआरएल चालू करने के लिए:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • जब आप एक ही पोस्ट कई सेक्शन में डालते हैं, तो आपका ब्लॉग सिस्टम अपने-आप कई यूआरएल सेव करता है.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • अगर आपका सर्वर अलग-अलग www/non-www http/https पर एक जैसा कॉन्टेंट दिखाने के लिए कॉन्फ़िगर किया गया हो:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • अगर आप जो कॉन्टेंट दूसरी साइटों को ऑफ़लाइन बांटने के लिए किसी ब्लॉग पर देते हैं, उसे उन डोमेन (साइटों) पर पूरा या थोड़ा-बहुत दिखाया जाता है:
    https://news.example.com/green-dresses-for-every-day-155672.html (सिंडिकेटेड पोस्ट) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (मूल पोस्ट)

मुझे कैननिकल यूआरएल क्यों चुनना चाहिए?

आपकाे इन वजहों से एक जैसे/डुप्लीकेट पेजों के सेट में से किसी पेज को खास तौर से कैननिकल पेज के तौर पर चुनना चाहिए:

  • यह बताने के लिए कि आप लोगों को खोज नतीजों में कौनसा यूआरएल दिखाना चाहते हैं. हो सकता है कि आप https://example.com/dresses/cocktail?gclid=ABCD के बजाय https://www.example.com/dresses/green/greendress.html से लोगों को अपने हरे रंग के कपड़ों के प्रॉडक्ट पेज तक पहुंचाना पसंद करें.
  • एक जैसे या डुप्लीकेट पेजों के लिए लिंक सिग्नलों को एक करने के लिए. इससे, सर्च इंजन को अलग-अलग यूआरएल के लिए मौजूद जानकारी (जैसे, उनके लिंक) को एक पसंदीदा यूआरएल में, एक साथ शामिल करने में मदद मिलती है. इसका मतलब है कि http://example.com/dresses/cocktail?gclid=ABCD के लिए दूसरी साइटों के लिंक https://www.example.com/dresses/green/greendress.html के लिंक के साथ मिलकर एक हो जाते हैं.
  • सिर्फ़ एक प्रॉडक्ट/विषय की ट्रैकिंग मेट्रिक को आसान बनाने के लिए. अलग-अलग तरह के यूआरएल होने की वजह से, किसी खास कॉन्टेंट के लिए एकजुट मेट्रिक पाना ज़्यादा मुश्किल होता है.
  • सिंडिकेटेड कॉन्टेंट को प्रबंधित करने के लिए. अगर आप अन्य डोमेन पर प्रकाशित करने के लिए अपने कॉन्टेंट का डुप्लीकेट बनाते हैं, तो आप पेज की रैंकिंग को अपने पसंदीदा यूआरएल के साथ मिलाना चाहते हैं.
  • डुप्लीकेट पेजों पर क्रॉलिंग में समय गंवाने से बचने के लिए. आपको कोशिश करनी होगी कि Googlebot आपकी साइट का ज़्यादा से ज़्यादा कॉन्टेंट क्रॉल कर ले. इसलिए, बेहतर होगा कि वह एक ही पेज के डेस्कटॉप और मोबाइल वर्शन को क्रॉल करने के बजाय, आपकी साइट के नए (या अपडेट किए गए) पेजों को क्रॉल करे.

Google के हिसाब से, मेरी साइट का कैननिकल यूआरएल कौनसा है?

यूआरएल जांचने वाले टूल का इस्तेमाल करके जानें कि Google ने किस पेज काे कैननिकल के तौर पर चुना है. ध्यान दें, भले ही आपने किसी पेज को खास तौर से कैननिकल पेज के तौर पर मार्क किया हो, फिर भी Google किसी अन्य पेज को कैननिकल के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं, जैसे कि पेज का कॉन्टेंट या परफ़ॉर्मेंस.

समस्याओं को हल करना

अगर कोई कैननिकल यूआरएल ऐसी प्रॉपर्टी में है जिसके आप मालिक नहीं हैं, तो आप अपने डुप्लीकेट पेज का ट्रैफ़िक नहीं देख पाएंगे. यहां कैननिकल पेज की किसी अलग प्रॉपर्टी में मौजूद होने की कुछ आम वजहें बताई गई हैं:

  • भाषा के गलत वैरिएंट चुनना: अगर आपकी ऐसी कई वेबसाइटें हैं जिनमें दुनिया भर के उपयोगकर्ताओं के लिए एक जैसा कॉन्टेंट उनकी स्थानीय भाषा में उपलब्ध कराया जाता है, तो अलग-अलग भाषा और इलाके के हिसाब से बनाई गई साइटों के लिए तय किए गए दिशा-निर्देशों का पालन ज़रूर करें.
  • गलत कैननिकल टैग: कुछ सीएमएस प्लग इन या कॉन्टेंट मैनेजमेंट सिस्टम (सीएमएस), यूआरएल के कैननिकल होने की जांच करने की तकनीकों का गलत इस्तेमाल कर सकते हैं. इससे वे आपकी साइट पर आने वाले उपयोगकर्ता या क्रॉलर को किसी दूसरी साइट पर मौजूद यूआरएल पर भेज सकते हैं. देख लें कि कहीं आपके कॉन्टेंट में यह समस्या तो नहीं है. अगर आपकी साइट ऐसे यूआरएल को कैननिकल यूआरएल मान रही है जिसे आम तौर पर कैननिकल यूआरएल नहीं चुना जाना चाहिए, तो यह rel="canonical" के गलत इस्तेमाल या 301 रीडायरेक्ट की वजह से हो सकता है. इस समस्या को तुरंत ठीक करें.
  • गलत तरीके से कॉन्फ़िगर किए गए सर्वर: होस्ट करने की कुछ सेटिंग गलत तरीके से सेट करने की वजह से ऐसे क्रॉस-डोमेन यूआरएल को चुन लिया जाता है जिसे आम तौर पर नहीं चुना जाना चाहिए. उदाहरण के लिए:
    • कोई सर्वर गलत तरीके से कॉन्फ़िगर हो सकता है. ऐसा हाेने पर, b.com के किसी यूआरएल के लिए अनुरोध करने पर a.com का कॉन्टेंट दिख सकता है
    • दो अलग-अलग वेब सर्वर, एक जैसे सॉफ़्ट 404 गड़बड़ी वाले उन पेजों पर भेज सकते हैं जिन्हें Google गड़बड़ी वाले पेजों के तौर पर पहचान नहीं पाया था.
  • नुकसान पहुंचाने के लिए की गई हैकिंग: वेबसाइटों पर किए गए कुछ हमलों में ऐसा कोड डाला जाता है जिसकी वजह से अनुरोध करने पर जवाब में एचटीटीपी 301 रीडायरेक्ट मिलता है. इसके अलावा, एचटीएमएल <head> या एचटीटीपी हेडर में ऐसा क्रॉस-डोमेन rel="canonical" लिंक एलिमेंट भी डाला जा सकता है जो अक्सर नुकसान पहुंचाने या स्पैम वाले कॉन्टेंट के यूआरएल पर रीडायरेक्ट करता है. इन मामलों में हमारे एल्गोरिदम, छेड़छाड़ की गई वेबसाइट पर मौजूद यूआरएल चुनने के बजाय, नुकसान पहुंचाने या स्पैम वाले यूआरएल को चुन सकते हैं.
  • नकली वेबसाइट: बहुत कम मामलों में, हमारा एल्गोरिदम किसी ऐसी बाहरी साइट से यूआरएल चुन सकता है जिस पर आपकी अनुमति के बिना आपका कॉन्टेंट मौजूद हो. अगर आपको लगता है कि कोई अन्य साइट, आपके कॉन्टेंट को डुप्लीकेट करके कॉपीराइट कानून का उल्लंघन कर रही है, तो आप उस साइट के होस्ट से कॉन्टेंट हटाने का अनुरोध कर सकते हैं. साथ ही, आप Google से भी यह अनुरोध कर सकते हैं कि कॉपीराइट के नियमाें का उल्लंघन करने वाले पेजों को खोज नतीजाें से हटा दिया जाए. इसके लिए, आप डिजिटल मिलेनियम कॉपीराइट ऐक्ट के तहत अनुरोध कर सकते हैं.

कैननिकल पेज तय करना

आपके इस्तेमाल के आधार पर, एक डुप्लीकेट सेट में कैननिकल पेज बताए जाने के कुछ और तरीके नीचे दिए गए हैं:

तरीका और ब्यौरा
सामान्य दिशा-निर्देश यूआरएल के कैननिकल होने की जांच करने के सभी तरीकों के लिए, इन दिशा-निर्देशों का पालन करें.
rel=canonical <link> टैग

कैननिकल पेज पर ले जाने वाले सभी डुप्लीकेट पेजों के लिए, कोड में एक <link> टैग जोड़ें.

फ़ायदे:

  • अनगिनत संख्या में डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • पेज का आकार बढ़ा सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
  • सिर्फ़ एचटीएमएल पेजों के लिए काम करता है, PDF जैसी फ़ाइलों के लिए नहीं. ऐसे मामलों में, आप rel=canonical एचटीटीपी हेडर इस्तेमाल कर सकते हैं.
rel=canonical एचटीटीपी हेडर

आपका पेज खोजे जाने पर एक rel=canonical हेडर भेजें.

फ़ायदे:

  • पेज का आकार नहीं बढ़ाता.
  • अनगिनत संख्या में डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
साइटमैप

साइटमैप में अपने कैननिकल पेज बताएं.

फ़ायदे:

  • खास तौर पर बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • Googlebot को अब भी ऐसे किसी कैननिकल पेज से जुड़ा डुप्लीकेट तय करना होगा जिसके बारे में आप साइटमैप में बताते हैं.
  • Googlebot के लिए, rel=canonical मैपिंग तकनीक के मुकाबले कमज़ोर सिग्नल.
301 रीडायरेक्ट 301 रीडायरेक्ट का इस्तेमाल Googlebot को यह बताने के लिए करें कि दूसरा वेबलिंक दिए गए यूआरएल के मुकाबले एक बेहतर वर्शन है. इसका इस्तेमाल सिर्फ़ तब करें, जब किसी डुप्लीकेट पेज को रोकना हो.
एएमपी के वैरिएंट अगर आपका कोई फ़ॉर्मैट एक एएमपी पेज है, तो कैननिकल पेज और एएमपी फ़ॉर्मैट के बारे में बताने के लिए, आपको एएमपी दिशा-निर्देशों का पालन करना होगा.

हमारी सलाह है कि आप इनमें से किसी तरीके का इस्तेमाल करें. हालांकि, ऐसा करना ज़रूरी नहीं है. अगर आप कोई कैननिकल यूआरएल नहीं बताते हैं, तो हम अपने हिसाब से सबसे अच्छे वर्शन या यूआरएल की पहचान करेंगे.

सामान्य दिशा-निर्देश

यूआरएल के कैननिकल होने की जांच करने के सभी तरीके जानने के लिए, इन सामान्य दिशा-निर्देशों का पालन करें.

सामान्य दिशा-निर्देश

  • यूआरएल के कैननिकल होने की जांच करने के लिए, robots.txt फ़ाइल का इस्तेमाल न करें.
  • यूआरएल के कैननिकल होने की जांच करने के लिए, यूआरएल हटाने वाले टूल का इस्तेमाल न करें: ऐसा करने से यूआरएल के सभी वर्शन खोज नतीजों से हटा दिए जाते हैं.
  • यूआरएल के कैननिकल होने की जांच करने की एक जैसी या अलग-अलग तकनीकों का इस्तेमाल करके, एक ही पेज के लिए अलग-अलग यूआरएल को कैननिकल के तौर पर तय न करें (उदाहरण के लिए, ऐसा न हो कि किसी पेज के लिए साइटमैप में एक यूआरएल और rel="canonical" का इस्तेमाल करके किसी दूसरे यूआरएल को कैननिकल के तौर पर तय कर दिया जाए).
  • किसी कैननिकल पेज को चुने जाने से रोकने के लिए noindex का इस्तेमाल न करें. यह निर्देश, इंडेक्स से पेज को बाहर करने के लिए है, कैननिकल पेज की पसंद को प्रबंधित करने के लिए नहीं.
  • hreflang टैग इस्तेमाल करते समय, एक कैननिकल पेज ज़रूर चुनें. अपना कैननिकल पेज उसी भाषा में चुनें जिसमें आपका मूल वेबपेज है. अगर उस भाषा में कैननिकल पेज मौजूद न हो, तो दूसरी सबसे ठीक भाषा के पेज को चुनें.

  • अपनी साइट में लिंक करते समय, डुप्लीकेट यूआरएल के बजाय कैननिकल यूआरएल से लिंक करें. अगर आप हमेशा कैननिकल यूआरएल से ही लिंक करेंगे, तो Google को आपकी पसंद समझने में आसानी होगी.

कैननिकल यूआरएल के लिए एचटीटीपी के बजाय एचटीटीपीएस को चुनें

Google एक जैसे पेजों के लिए, एचटीटीपी के बजाय एचटीटीपीएस पेजों को कैननिकल के तौर पर चुनता है. इसमें नीचे दी गई समस्याएं या आपस में टकराने वाले सिग्नल से जुड़े मामले शामिल नहीं हैं:

  • एचटीटीपीएस पेज में गलत SSL प्रमाणपत्र है.
  • एचटीटीपीएस पेज में ऐसी चीज़ें (इमेज के अलावा दूसरी चीज़ें) शामिल हैं जो सुरक्षित नहीं, लेकिन ज़रूरी हैं.
  • एचटीटीपीएस पेज उपयोगकर्ताओं को किसी एचटीटीपी पेज पर या इसके ज़रिए दूसरे वेबलिंक पर भेजता है.
  • एचटीटीपीएस पेज में एचटीटीपी पेज का एक rel="canonical" लिंक शामिल है.

हालांकि, हमारे सिस्टम डिफ़ॉल्ट तौर पर एचटीटीपी पेजों की जगह एचटीटीपीएस पेज ही चुनते हैं. फिर भी, आप इनमें से किसी भी कार्रवाई से तय कर सकते हैं कि ऐसा हो रहा है:

  • एचटीटीपी पेज से एचटीटीपीएस पेज पर रीडायरेक्ट जोड़ें.
  • एचटीटीपी पेज से एचटीटीपीएस पेज पर एक rel="canonical" लिंक जोड़ें.
  • एचएसटीएस लागू करें.

Google को गलती से एचटीटीपी पेज को कैननिकल बनाने से रोकने के लिए, आपको नीचे दी गई चीज़ों से बचना चाहिए:

  • गलत SSL प्रमाणपत्र और एचटीटीपीएस-से-एचटीटीपी रीडायरेक्ट की वजह से हम एचटीटीपी को बहुत ज़्यादा ज़रूरी मान लेते हैं. एचएसटीएस लागू करने से इसे बहुत ज़्यादा ज़रूरी मानना बंद नहीं किया जा सकता है.
  • अपने साइटमैप या hreflang कोडिंग में एचटीटीपीएस वर्शन के बजाय एचटीटीपी पेज शामिल करना.
  • गलत होस्ट वैरिएंट के लिए अपने SSL/TLS प्रमाणपत्र का इस्तेमाल करना: उदाहरण के लिए, www.example.com की जगह example.com के लिए अपने प्रमाणपत्र का इस्तेमाल करना. प्रमाणपत्र आपकी साइट के पूरे यूआरएल से मेल खाना चाहिए या फिर वह ऐसा वाइल्डकार्ड प्रमाणपत्र हो जिसे एक डोमेन के कई सबडोमेन के लिए इस्तेमाल किया जा सके.

नई तकनीकें इस्तेमाल करने वाले उपयोगकर्ता: Google को यह बताना कि वह डाइनैमिक पैरामीटर का इस्तेमाल न करे

पैरामीटर हैंडलिंग का इस्तेमाल करके, Googlebot को बताएं कि क्रॉल करते समय किन पैरामीटर का इस्तेमाल नहीं करना है. कुछ पैरामीटर इस्तेमाल नहीं करने से, Google के इंडेक्स में डुप्लीकेट कॉन्टेंट कम हो सकता है. इससे आपकी साइट को ज़्यादा अच्छी तरह क्रॉल करने में मदद मिलेगी. उदाहरण के लिए, अगर आप यह बताते हैं कि पैरामीटर sessionid को इस्तेमाल नहीं करना है, तो Googlebot इन दो यूआरएल को डुप्लीकेट मानेगा:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

खास तरीके

डुप्लीकेट यूआरएल या डुप्लीकेट/मिलते-जुलते पेजों के लिए, एक कैननिकल यूआरएल बताने के लिए इनमें से कोई तरीका चुनें.

देख लें कि सभी तरीकों के लिए, ऊपर बताए गए सामान्य दिशा-निर्देशों का पालन किया जा रहा है.

आप पेज हेडर में <link> टैग का इस्तेमाल करके, यह बता सकते हैं कि कोई पेज किसी दूसरे पेज का डुप्लीकेट है या नहीं.

मान लीजिए कि आप https://example.com/dresses/green-dresses को कैननिकल यूआरएल के तौर पर चुनना चाहते हैं, जबकि इस कॉन्टेंट को कई दूसरे यूआरएल से भी ऐक्सेस किया जा सकता है. ऐसे में, इस यूआरएल को कैननिकल के तौर पर दिखाने के लिए यह तरीका अपनाएं:

  1. सभी डुप्लीकेट पेजों को rel="canonical" लिंक एलिमेंट से मार्क करना. कैननिकल पेज पर ले जाने के लिए, डुप्लीकेट पेजों के <head> सेक्शन में एट्रिब्यूट rel="canonical" के साथ <link> एलिमेंट जोड़ें, जैसे इसमें किया गया है:
    <link rel="canonical" href="https://example.com/dresses/green-dresses" />

  2. अगर कैननिकल पेज का कोई मोबाइल वर्शन है, तो उसका वह rel="alternate" लिंक जोड़ें जो पेज के मोबाइल वर्शन पर ले जाता हो:
    <link rel="alternate" media="only screen and (max-width: 640px)" href="http://m.example.com/dresses/green-dresses">

  3. कोई भी hreflang या दूसरे रीडायरेक्ट जोड़ें जो पेज के लिए सही हो.

rel="canonical" एचटीटीपी हेडर का इस्तेमाल करना

अगर आप अपने सर्वर को कॉन्फ़िगर कर सकते हैं, तो आप पीडीएफ़ फ़ाइल जैसे बिना एचटीएमएल वाले दस्तावेज़ के कैननिकल यूआरएल तय करने के लिए rel="canonical" एचटीटीपी हेडर (एचटीएमएल टैग के बजाय) इस्तेमाल कर सकते हैं.

उदाहरण के लिए, अगर आपकी किसी पीडीएफ़ फ़ाइल को कई यूआरएल से खोला जा सकता है, तो डुप्लीकेट यूआरएल के लिए नीचे दिए गए हेडर, जैसे कि rel="canonical" एचटीटीपी हेडर का इस्तेमाल करके, आप Googlebot को बता सकते हैं कि पीडीएफ़ फ़ाइल का कैननिकल यूआरएल कौनसा है:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

फ़िलहाल, Google पर यह तरीका सिर्फ़ वेब खोज के नतीजों के लिए काम करता है.

साइटमैप का इस्तेमाल करना

अपने हर पेज के लिए एक कैननिकल यूआरएल चुनें और उसे साइटमैप में सबमिट करें. साइटमैप में दिए गए सभी पेजों को कैननिकल बताया गया है; कॉन्टेंट का मिलान करके, Googlebot यह तय करेगा कि कौनसा पेज (अगर कोई है) डुप्लीकेट है.

हम इस बात की गारंटी नहीं देते कि हम साइटमैप यूआरएल को कैननिकल मानेंगे, लेकिन यह एक बड़ी साइट के लिए कैननिकल को समझाने का एक आसान तरीका है. साथ ही, साइटमैप Google को यह बताने का एक अच्छा तरीका है कि आप अपनी साइट पर किन पेजों को सबसे ज़्यादा ज़रूरी मानते हैं.

साइटमैप में ऐसे पेज शामिल न करें जो कैननिकल नहीं हैं. अगर साइटमैप का इस्तेमाल करते हैं, तो साइटमैप में सिर्फ़ कैननिकल यूआरएल बताएं.

अब काम न करने वाले यूआरएल के लिए 301 रीडायरेक्ट इस्तेमाल करें

इस तरीके का इस्तेमाल तब करें, जब आप मौजूदा डुप्लीकेट पेजों से छुटकारा पाना चाहते हैं. हालांकि, पुराने यूआरएल का इस्तेमाल करना बंद करने से पहले यह ज़रूर देख लें कि इसे आसानी से बदला जा सकता है.

मान लेते हैं कि आपके पेज पर कई तरीकों से पहुंचा जा सकता है:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

इनमें से किसी एक यूआरएल को अपने कैननिकल यूआरएल के तौर पर चुनें और अन्य यूआरएल से अपने पसंदीदा यूआरएल में ट्रैफ़िक भेजने के लिए 301 रीडायरेक्ट इस्तेमाल करें. सर्वर साइड पर 301 रीडायरेक्ट का होना, उपयोगकर्ताओं और सर्च इंजन को सही पेज पर ले जाने का सबसे अच्छा तरीका है. 301 स्थिति कोड का मतलब है कि किसी पेज को हमेशा के लिए किसी नई जगह पर ले जाया गया है.

अगर आप वेबसाइट होस्ट करने वाली किसी कंपनी की सेवा ले रहे हैं, तो 301 रीडायरेक्ट को सेट अप करने से जुड़े उनके दस्तावेज़ देखें.