डुप्लीकेट यूआरएल मिलाकर एक करना

अगर आपकी साइट पर कोई ऐसा पेज है जिसके कई यूआरएल हैं या एक जैसे कॉन्टेंट वाले कई पेज हैं, तो Google उन्हें एक ही पेज के डुप्लीकेट वर्शन मानता है. जैसे कि कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं. Google उस पेज के किसी एक यूआरएल को कैननिकल वर्शन के तौर पर चुनकर, उसे क्रॉल करेगा. बाकी सभी यूआरएल काे डुप्लीकेट यूआरएल मानकर, उन्हें कभी-कभी ही क्रॉल किया जाएगा.

अगर आप साफ़ ताैर पर Google को यह नहीं बतांएगे कि कौनसे यूआरएल को कैननिकल माना जाए, तो Google अपने हिसाब से एक कैननिकल यूआरएल चुन लेगा या दाेनाें ही यूआरएल काे बराबर मान लेगा. इससे हो सकता है कि आपके पेज, खोज नतीजों में सही से न दिखाए जाएं. इस बारे में ज़्यादा जानकारी, नीचे दिए गए सेक्शन कैननिकल यूआरएल क्यों चुनना चाहिए? में माैजूद है.

Googlebot, कैननिकल यूआरएल को कैसे चुनता और इंडेक्स करता है

किसी साइट को इंडेक्स करते समय, Googlebot उस साइट के हर पेज के मुख्य कॉन्टेंट का पता लगाने की कोशिश करता है. अगर Googlebot को एक ही साइट पर एक जैसे कई पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे सबसे ज़्यादा जानकारी देने वाला और काम का लगता है. इस पेज को कैननिकल पेज के तौर पर मार्क किया जाता है. आपकी साइट के कैननिकल पेज को नियमित तौर पर क्रॉल किया जाएगा, जबकि डुप्लीकेट पेज कभी-कभी ही क्रॉल किए जाएंगे. इससे, आपकी साइट पर Google क्रॉलिंग के लोड को कम करने में मदद मिलती है.

Google कई चीज़ों (या सिग्नल) को ध्यान में रखकर, कैननिकल पेज चुनता है. उदाहरण के लिए, पेज की क्वालिटी, साइटमैप में यूआरएल की मौजूदगी, पेज को दिखाने के लिए किस प्रोटोकॉल का इस्तेमाल किया जाता है - एचटीटीपी या फिर एचटीटीपीएस, और पेज पर कोई rel=canonical लेबल है या नहीं. आप इन तरीकों से Google को अपनी पसंद बता सकते हैं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं.

किसी पेज के अलग-अलग भाषाओं वाले वर्शन तभी डुप्लीकेट माने जाते हैं, जब पेज का मुख्य कॉन्टेंट एक ही भाषा में हो. इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गै़र-ज़रूरी टेक्स्ट का तो अनुवाद किया गया हो, लेकिन मुख्य लेख एक ही भाषा में दिया गया हो.

Google, कॉन्टेंट और क्वॉलिटी का आकलन करने के लिए कैननिकल पेजों का इस्तेमाल करता है. Google Search के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता की क्वेरी के हिसाब से कोई डुप्लीकेट पेज बेहतर हो, तो कैननिकल पेज की जगह वह पेज दिखाया जाता है. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा हो, तो खोज नतीजों में शायद मोबाइल पेज ही दिखाया जाएगा. भले ही, पेज के डेस्कटॉप वर्शन को कैननिकल पेज के तौर पर चुना क्यों न गया हो.

मिलते-जुलते या डुप्लीकेट पेज रखने की वजहें

आपकी साइट पर एक ही पेज के अलग-अलग यूआरएल हो सकते हैं. साथ ही, अलग-अलग यूआरएल पर डुप्लीकेट या एक जैसे दिखने वाले पेज भी हो सकते हैं. इसकी सबसे आम वजहें यहां दी गई हैं:

  • कई तरह के डिवाइस पर काम करने के लिए:
    https://example.com/news/koala-rampage
    https://m.example.com/news/koala-rampage
    https://amp.example.com/news/koala-rampage
  • अगर खोज पैरामीटर या सेशन आईडी जैसी चीज़ों के लिए, डाइनैमिक यूआरएल चालू करना हो:
    https://www.example.com/products?category=dresses&color=green
    https://example.com/dresses/cocktail?gclid=ABCD
    https://www.example.com/dresses/green/greendress.html
  • अगर आप एक ही पोस्ट कई सेक्शन में डालते हैं, तो आपका ब्लॉग सिस्टम अपने-आप कई यूआरएल सेव करता है.
    https://blog.example.com/dresses/green-dresses-are-awesome/
    https://blog.example.com/green-things/green-dresses-are-awesome/
  • अगर आपका सर्वर अलग-अलग www/non-www http/https पर एक जैसा कॉन्टेंट दिखाने के लिए कॉन्फ़िगर किया गया हो:
    http://example.com/green-dresses
    https://example.com/green-dresses
    http://www.example.com/green-dresses
    
  • अगर आप दूसरी साइटों को सिंडिकेशन के लिए किसी ब्लॉग पर कॉन्टेंट देते हैं और उस कॉन्टेंट को उन डोमेन पर पूरा या थोड़ा-बहुत दिखाया जाता है:
    https://news.example.com/green-dresses-for-every-day-155672.html (सिंडिकेटेड पोस्ट) https://blog.example.com/dresses/green-dresses-are-awesome/3245/ (मूल पोस्ट)

कैननिकल यूआरएल चुनने की वजहें

आपको डुप्लीकेट/एक जैसे पेजों के सेट में से किसी पेज को खास तौर से कैननिकल पेज के तौर पर क्यों चुनना चाहिए, इसकी कई वजहें हो सकती हैं:

  • यह बताने के लिए कि आप लोगों को, खोज के नतीजों में कौनसा यूआरएल दिखाना चाहते हैं. हो सकता है आप चाहें कि लोग आपके हरे रंग के कपड़ों के प्रॉडक्ट पेज पर, https://example.com/dresses/cocktail?gclid=ABCD के बजाय https://www.example.com/dresses/green/greendress.html से पहुंचें.
  • एक जैसे या डुप्लीकेट पेजों के लिए लिंक सिग्नलों को एक करने के लिए. इससे, सर्च इंजन को अलग-अलग यूआरएल के लिए मौजूद जानकारी (जैसे, उनके लिंक) को एक पसंदीदा (कैननिकल) यूआरएल में, एक साथ शामिल करने में मदद मिलती है. इसका मतलब है कि http://example.com/dresses/cocktail?gclid=ABCD के लिए दूसरी साइटों के लिंक, https://www.example.com/dresses/green/greendress.html के लिंक के साथ मिलकर एक हो जाते हैं.
  • सिर्फ़ एक प्रॉडक्ट/विषय की ट्रैकिंग मेट्रिक को आसान बनाने के लिए. अलग-अलग तरह के यूआरएल होने की वजह से, किसी खास कॉन्टेंट के लिए एक ऐसा मेट्रिक पाना मुश्किल होता है जिसमें सभी यूआरएल की जानकारी शामिल हो.
  • सिंडिकेटेड कॉन्टेंट को मैनेज करने के लिए. अगर आप अन्य डोमेन पर प्रकाशित करने के लिए अपने कॉन्टेंट का डुप्लीकेट बनाते हैं, तो आप यह पक्का करना चाहेंगे कि आपका पसंदीदा (कैननिकल) यूआरएल, खोज के नतीजों में दिखे.
  • डुप्लीकेट पेजों पर क्रॉलिंग में समय गंवाने से बचने के लिए. आप चाहेंगे कि Googlebot आपकी साइट का ज़्यादा से ज़्यादा कॉन्टेंट क्रॉल कर ले. इसलिए, बेहतर होगा कि वह एक ही पेज के डेस्कटॉप और मोबाइल वर्शन को क्रॉल करने के बजाय, आपकी साइट के नए (या अपडेट किए गए) पेजों को क्रॉल करे.

जानना कि Google किस पेज को कैननिकल मानता है

यूआरएल जांचने वाले टूल का इस्तेमाल करके जानें कि Google ने किस पेज को कैननिकल के तौर पर चुना है.

कैननिकल पेज तय करना

अगर मिलते-जुलते पेजों या डुप्लीकेट यूआरएल के लिए कैननिकल यूआरएल तय करना हो, तो यहां दिए गए तरीकों में से किसी एक का इस्तेमाल करें. सामान्य दिशा-निर्देशों का पालन ज़रूर करें.

तरीका और ब्यौरा
rel=canonical <link> टैग

कैननिकल पेज पर ले जाने वाले सभी डुप्लीकेट पेजों के लिए, कोड में एक <link> टैग जोड़ें.

फ़ायदे:
  • अनगिनत डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • इससे, पेज का साइज़ बढ़ सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
  • सिर्फ़ एचटीएमएल पेजों के लिए काम करता है, PDF जैसी फ़ाइलों के लिए नहीं. ऐसे मामलों में, आप rel=canonical एचटीटीपी हेडर इस्तेमाल कर सकते हैं.
rel=canonical एचटीटीपी हेडर

आपका पेज खोजे जाने पर एक rel=canonical हेडर भेजें.

फ़ायदे:

  • पेज का साइज़ नहीं बढ़ाता.
  • अनगिनत संख्या में डुप्लीकेट पेज मैप कर सकता है.

नुकसान:

  • बड़ी साइटों पर या ऐसी साइटों पर मैपिंग करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
साइटमैप

साइटमैप में अपने कैननिकल पेजों के बारे में जानकारी दें.

फ़ायदे:

  • खास तौर पर, बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • Googlebot को अब भी ऐसे किसी कैननिकल पेज से जुड़ा डुप्लीकेट तय करना होगा जिसके बारे में आप साइटमैप में बताते हैं.
  • Googlebot के लिए, rel=canonical मैपिंग तकनीक के मुकाबले कमज़ोर सिग्नल.
301 रीडायरेक्ट 301 रीडायरेक्ट का इस्तेमाल Googlebot को यह बताने के लिए करें कि दूसरा वेबलिंक, दिए गए यूआरएल के मुकाबले एक बेहतर वर्शन है. इसका इस्तेमाल सिर्फ़ तब करें, जब किसी डुप्लीकेट पेज को रोकना हो.
एएमपी के वैरिएंट अगर कोई वैरिएंट एक एएमपी पेज है, तो कैननिकल पेज और एएमपी फ़ॉर्मैट के बारे में बताने के लिए, आपको एएमपी दिशा-निर्देशों का पालन करना होगा.

सामान्य दिशा-निर्देश

यूआरएल के कैननिकल होने की जांच करने के सभी तरीकों के लिए, इन सामान्य दिशा-निर्देशों का पालन करें:

  • यूआरएल के कैननिकल होने की जांच करने के लिए, robots.txt फ़ाइल का इस्तेमाल न करें.
  • यूआरएल के कैननिकल होने की जांच करने के लिए, यूआरएल हटाने वाले टूल का इस्तेमाल न करें. ऐसा करने से यूआरएल के सभी वर्शन, Search के नतीजों से हटा दिए जाते हैं.
  • यूआरएल के कैननिकल होने की जांच करने की एक जैसी या अलग-अलग तकनीकों का इस्तेमाल करके, एक ही पेज के लिए अलग-अलग यूआरएल को कैननिकल के तौर पर तय न करें (उदाहरण के लिए, ऐसा न हो कि किसी पेज के लिए साइटमैप में एक यूआरएल को और rel="canonical" का इस्तेमाल करके किसी दूसरे यूआरएल को कैननिकल के तौर पर तय कर दिया जाए).
  • किसी कैननिकल पेज को चुने जाने से रोकने के लिए, noindex का इस्तेमाल न करें. यह डायरेक्टिव, इंडेक्स से पेज को बाहर करने के लिए है, पसंद के कैननिकल पेज के चुनाव को मैनेज करने के लिए नहीं.
  • hreflang टैग इस्तेमाल करते समय, एक कैननिकल पेज ज़रूर चुनें. अपना कैननिकल पेज उसी भाषा में चुनें जिसमें आपका मूल वेबपेज है. अगर उस भाषा में कैननिकल पेज मौजूद न हो, तो उसके हिसाब से सबसे ठीक भाषा के पेज को चुनें.

  • अपनी साइट में लिंक करते समय, डुप्लीकेट यूआरएल के बजाय कैननिकल यूआरएल से लिंक करें. अगर आप हमेशा कैननिकल यूआरएल से ही लिंक करेंगे, तो Google को आपकी पसंद समझने में आसानी होगी.

कैननिकल यूआरएल के लिए एचटीटीपी के बजाय एचटीटीपीएस को चुनना

Google एक जैसे पेजों के लिए, एचटीटीपी के बजाय एचटीटीपीएस पेजों को कैननिकल के तौर पर चुनता है. इसमें नीचे दी गई समस्याएं या आपस में टकराने वाले सिग्नल से जुड़े मामले शामिल नहीं हैं:

  • एचटीटीपीएस पेज में ऐसा एसएसएल सर्टिफ़िकेट शामिल हो जो गलत है.
  • एचटीटीपीएस पेज में ऐसी चीज़ें (इमेज के अलावा दूसरी चीज़ें) शामिल हैं जो सुरक्षित नहीं, लेकिन ज़रूरी हैं.
  • एचटीटीपीएस पेज, उपयोगकर्ताओं को किसी एचटीटीपी पेज पर या इसके ज़रिए दूसरे वेबलिंक पर भेजता है.
  • एचटीटीपीएस पेज में एचटीटीपी पेज का एक rel="canonical" लिंक शामिल हो.

हालांकि, हमारे सिस्टम डिफ़ॉल्ट रूप से एचटीटीपी पेजों की जगह एचटीटीपीएस पेजों को ही चुनते हैं. आप फिर भी इनमें से किसी भी कार्रवाई की मदद से यह तय कर सकते हैं कि ऐसा ही हो:

  • एचटीटीपी पेज से एचटीटीपीएस पेज पर रीडायरेक्ट जोड़ें.
  • एचटीटीपी पेज से एचटीटीपीएस पेज पर एक rel="canonical" लिंक जोड़ें.
  • एचएसटीएस लागू करें.

Google को गलती से एचटीटीपी पेज को कैननिकल बनाने से रोकने के लिए, आपको यहां बताई गई बातों से बचना चाहिए:

  • गलत TLS/एसएसएल सर्टिफ़िकेट इस्तेमाल करने और एचटीटीपीएस से एचटीटीपी पर रीडायरेक्ट करने से बचें. ऐसा होने पर Google, एचटीटीपी पेज को चुनना बुहत ज़्यादा ज़रूरी मान लेता है. एचएसटीएस लागू करने पर भी Google, एचटीटीपी पेज को चुनना ज़रूरी मानता है.
  • अपने साइटमैप या hreflang कोडिंग में एचटीटीपीएस वर्शन के बजाय एचटीटीपी पेज को शामिल करने से बचें.
  • गलत होस्ट वैरिएंट के लिए अपने एसएसएल/TLS सर्टिफ़िकेट का इस्तेमाल करने से बचें. उदाहरण के लिए, www.example.com की जगह example.com के लिए अपने सर्टिफ़िकेट का इस्तेमाल करने से बचें. सर्टिफ़िकेट आपकी साइट के पूरे यूआरएल से मेल खाना चाहिए या फिर वह ऐसा वाइल्डकार्ड सर्टिफ़िकेट हो जिसे एक डोमेन के कई सबडोमेन के लिए इस्तेमाल किया जा सके.

नई तकनीकें इस्तेमाल करने वाले उपयोगकर्ता: Google को यह बताना कि वह डाइनैमिक पैरामीटर का इस्तेमाल न करे

पैरामीटर हैंडलिंग का इस्तेमाल करके, Googlebot को बताएं कि क्रॉल करते समय किन पैरामीटर का इस्तेमाल नहीं करना है. कुछ पैरामीटर इस्तेमाल नहीं करने से, Google के इंडेक्स में डुप्लीकेट कॉन्टेंट कम हो सकता है. इससे आपकी साइट को ज़्यादा क्रॉल किया जा सकता है. उदाहरण के लिए, अगर आप यह बताते हैं कि पैरामीटर sessionid को इस्तेमाल नहीं करना है, तो Googlebot इन दो यूआरएल को डुप्लीकेट मानेगा:

  • https://www.example.com/dresses/green.php?sessionid=273749
  • https://www.example.com/dresses/green.php

एक पेज को किसी अन्य पेज के डुप्लीकेट के तौर पर दिखाने के लिए, आप अपने एचटीएमएल के head सेक्शन में, <link> टैग का इस्तेमाल कर सकते हैं.

मान लीजिए कि आप https://example.com/dresses/green-dresses को कैननिकल यूआरएल के तौर पर चुनना चाहते हैं, जबकि इस कॉन्टेंट को कई अन्य यूआरएल से भी ऐक्सेस किया जा सकता है. ऐसे में, इस यूआरएल को कैननिकल यूआरएल के तौर पर दिखाने के लिए यह तरीका अपनाएं:

  1. सभी डुप्लीकेट पेजों को rel="canonical" लिंक एलिमेंट से मार्क करें.

    कैननिकल पेज पर ले जाने के लिए, डुप्लीकेट पेजों के <head> सेक्शन में rel="canonical" एट्रिब्यूट वाला <link> एलिमेंट जोड़ें. उदाहरण के लिए:

    <link rel="canonical" href="https://example.com/dresses/green-dresses" />
  2. अगर कैननिकल पेज का कोई मोबाइल वर्शन है, तो उस मोबाइल वर्शन पर ले जाने के लिए पेज में rel="alternate" लिंक जोड़ें:
    <link rel="alternate" media="only screen and (max-width: 640px)"  href="http://m.example.com/dresses/green-dresses">
  3. कोई भी hreflang टैग या दूसरे रीडायरेक्ट जोड़ें, जो पेज के लिए सही हों.

rel="canonical" एचटीटीपी हेडर का इस्तेमाल करना

अगर आप अपने सर्वर को कॉन्फ़िगर कर सकते हैं, तो आप Search के साथ काम करने वाले दस्तावेज़ का कैननिकल यूआरएल तय करने के लिए, rel="canonical" एचटीटीपी हेडर (एचटीएमएल टैग के बजाय) का इस्तेमाल कर सकते हैं. इसमें, PDF फ़ाइलों जैसे बिना एचटीएमएल वाले दस्तावेज़ भी शामिल हैं.

अगर आप किसी PDF फ़ाइल को खोज के नतीजों में कई यूआरएल के ज़रिए दिखाते हैं, तो आप rel="canonical" एचटीटीपी हेडर दिखाकर, Googlebot को बता सकते हैं कि PDF फ़ाइल का कैननिकल यूआरएल कौनसा है:

Link: <http://www.example.com/downloads/white-paper.pdf>; rel="canonical"

फ़िलहाल, Google पर यह तरीका सिर्फ़ वेब खोज के नतीजों के लिए काम करता है.

साइटमैप का इस्तेमाल करना

अपने हर पेज के लिए एक कैननिकल यूआरएल चुनें और उसे साइटमैप में सबमिट करें. साइटमैप में दिए गए सभी पेजों को कैननिकल बताया गया है. Googlebot, कॉन्टेंट का मिलान करके यह तय करेगा कि कौनसे पेज (अगर कोई है, तो) डुप्लीकेट हैं.

हम इस बात की गारंटी नहीं देते हैं कि हम साइटमैप में दिए गए यूआरएल को कैननिकल मानेंगे, लेकिन यह एक बड़ी साइट के लिए कैननिकल यूआरएल तय करने का एक आसान तरीका है. साथ ही, साइटमैप Google को यह बताने का एक अच्छा तरीका है कि आप अपनी साइट पर किन पेजों को सबसे ज़्यादा अहम मानते हैं.

साइटमैप में ऐसे पेजों को शामिल न करें जो कैननिकल नहीं हैं. अगर आप किसी साइटमैप का इस्तेमाल कर रहे हैं, तो साइटमैप में सिर्फ़ कैननिकल यूआरएल के बारे में ही बताएं.

अब काम न करने वाले यूआरएल के लिए, 301 रीडायरेक्ट का इस्तेमाल करना

इस तरीके का इस्तेमाल तब करें, जब आप मौजूदा डुप्लीकेट पेजों से छुटकारा पाना चाहते हैं. हालांकि, आप पुराने यूआरएल का इस्तेमाल बंद करने से पहले यह पक्का कर लेना चाहते हैं कि इसे आसानी से बदला जा सके.

मान लेते हैं कि आपके पेज पर कई तरीकों से पहुंचा जा सकता है:

  • https://example.com/home
  • https://home.example.com
  • https://www.example.com

इनमें से किसी एक यूआरएल को अपने कैननिकल यूआरएल के तौर पर चुनें और अन्य यूआरएल से अपने पसंदीदा यूआरएल में ट्रैफ़िक भेजने के लिए, 301 रीडायरेक्ट इस्तेमाल करें. सर्वर साइड पर 301 रीडायरेक्ट का होना, उपयोगकर्ताओं और सर्च इंजन को सही पेज पर ले जाने का सबसे अच्छा तरीका है. 301 स्थिति कोड का मतलब है कि किसी पेज को हमेशा के लिए किसी नई जगह पर ले जाया गया है.

अगर आप वेबसाइट होस्ट करने वाली किसी कंपनी की सेवा ले रहे हैं, तो 301 रीडायरेक्ट को सेट अप करने से जुड़े उनके दस्तावेज़ देखें.

समस्याओं को हल करना

अगर कोई कैननिकल यूआरएल ऐसी प्रॉपर्टी में है जिसके आप मालिक नहीं हैं, तो आप अपने डुप्लीकेट पेज का ट्रैफ़िक नहीं देख पाएंगे. यहां, कैननिकल पेज के किसी अलग प्रॉपर्टी में मौजूद होने की कुछ आम वजहें बताई गई हैं:

  • भाषा के गलत वैरिएंट चुनना: अगर आपकी ऐसी कई वेबसाइटें हैं जिनमें दुनिया भर के उपयोगकर्ताओं के लिए एक जैसा कॉन्टेंट उनकी स्थानीय भाषा में उपलब्ध कराया जाता है, तो अलग-अलग भाषा और इलाके के हिसाब से बनाई गई साइटों के लिए तय किए गए दिशा-निर्देशों का पालन ज़रूर करें.
  • गलत कैननिकल टैग: कुछ सीएमएस प्लग इन या कॉन्टेंट मैनेजमेंट सिस्टम (सीएमएस), यूआरएल के कैननिकल होने की जांच करने की तकनीकों का गलत इस्तेमाल कर सकते हैं. इससे वे आपकी साइट पर आने वाले उपयोगकर्ता या क्रॉलर को, किसी दूसरी साइट पर मौजूद यूआरएल पर भेज सकते हैं. देख लें कि कहीं आपके कॉन्टेंट में यह समस्या तो नहीं है. अगर आपकी साइट ऐसे यूआरएल को कैननिकल यूआरएल मान रही है जिसे आम तौर पर कैननिकल यूआरएल नहीं चुना जाना चाहिए, तो यह rel="canonical" के गलत इस्तेमाल या 301 रीडायरेक्ट की वजह से हो सकता है. इस समस्या को तुरंत ठीक करें.
  • गलत तरीके से कॉन्फ़िगर किए गए सर्वर: होस्ट करने की कुछ सेटिंग को गलत तरीके से सेट करने की वजह से, ऐसे क्रॉस-डोमेन यूआरएल को चुन लिया जाता है जिसे आम तौर पर नहीं चुना जाना चाहिए. उदाहरण के लिए:
    • कोई सर्वर गलत तरीके से कॉन्फ़िगर हो सकता है. ऐसा हाेने पर, b.com के किसी यूआरएल के लिए अनुरोध करने पर a.com का कॉन्टेंट दिख सकता है
    • दो अलग-अलग वेब सर्वर, एक जैसे सॉफ़्ट 404 गड़बड़ी वाले उन पेजों पर भेज सकते हैं जिन्हें Google, गड़बड़ी वाले पेजों के तौर पर पहचान नहीं पाया था.
  • नुकसान पहुंचाने के लिए की गई हैकिंग: वेबसाइटों पर होने वाले कुछ हमलों में ऐसा कोड डाला जाता है जिसकी वजह से, अनुरोध करने पर जवाब में एचटीटीपी 301 रीडायरेक्ट मिलता है. इसके अलावा, एचटीएमएल <head> या एचटीटीपी हेडर में ऐसा क्रॉस-डोमेन rel="canonical" लिंक एलिमेंट भी डाला जा सकता है जो अक्सर नुकसान पहुंचाने या स्पैम वाले कॉन्टेंट को होस्ट करने वाले यूआरएल पर रीडायरेक्ट करता है. इन मामलों में हमारे एल्गोरिदम, छेड़छाड़ की गई वेबसाइट पर मौजूद यूआरएल चुनने के बजाय, नुकसान पहुंचाने या स्पैम वाले यूआरएल को चुन सकते हैं.
  • नकली वेबसाइट: बहुत कम मामलों में, हमारा एल्गोरिदम किसी ऐसी बाहरी साइट से यूआरएल चुन सकता है जिस पर आपकी अनुमति के बिना आपका कॉन्टेंट मौजूद हो. अगर आपको लगता है कि कोई अन्य साइट, आपके कॉन्टेंट को डुप्लीकेट करके कॉपीराइट कानून का उल्लंघन कर रही है, तो आप उस साइट के होस्ट से कॉन्टेंट हटाने का अनुरोध कर सकते हैं. साथ ही, आप Google से भी यह अनुरोध कर सकते हैं कि कॉपीराइट के नियमाें का उल्लंघन करने वाले पेजों को खोज नतीजाें से हटा दिया जाए. इसके लिए, आप डिजिटल मिलेनियम कॉपीराइट ऐक्ट के तहत अनुरोध कर सकते हैं.