मंगलवार, 20 अप्रैल, 2010
यूआरएल हटाने से जुड़ी जानकारी देने वाली हमारी सीरीज़ के तीसरे एपिसोड में आपका स्वागत है! हमने पहले और दूसरे एपिसोड में इन दो चीज़ों पर बात की: अपने कंट्रोल वाले कॉन्टेंट को तुरंत हटाना और कैश मेमोरी को तुरंत हटाने के लिए अनुरोध करना. आज हम जानेंगे कि Google का, यूआरएल हटाने वाला सार्वजनिक टूल इस्तेमाल करके, खोज के नतीजों से कॉन्टेंट हटाने का अनुरोध कैसे किया जा सकता है. यह अनुरोध ऐसे कॉन्टेंट के लिए है जो मूल रूप से, आपके कंट्रोल से बाहर वाली वेबसाइटों पर मौजूद हो.
Google, ऐसे दो टूल उपलब्ध कराता है जिनकी मदद से, कॉन्टेंट को तुरंत हटाने का अनुरोध किया जा सकता है:
- पुष्टि किए गए यूआरएल को हटाने वाला टूल: इस टूल का इस्तेमाल तब किया जाता है, जब आपको Google के खोज के नतीजों से कॉन्टेंट हटाने का अनुरोध करना हो और वह कॉन्टेंट ऐसी साइट पर पब्लिश किया गया हो जिसके लिए आपके मालिकाना हक की पुष्टि, वेबमास्टर टूल में की जा चुकी है. जैसे, आपका ब्लॉग या आपकी कंपनी की साइट
- यूआरएल हटाने वाला सार्वजनिक टूल: इस टूल का इस्तेमाल तब किया जाता है, जब आपको Google के खोज के नतीजों से कॉन्टेंट हटाने का अनुरोध करना हो और वह कॉन्टेंट ऐसी साइट पर पब्लिश किया गया हो जिसके लिए आपके मालिकाना हक की पुष्टि नहीं की जा सकती. जैसे, आपके दोस्त का ब्लॉग
कभी-कभी यह हो सकता है कि आपको जो जानकारी हटानी हो वह मूल रूप से, आपके मालिकाना हक या कंट्रोल से बाहर वाली साइट पर मौजूद हो. हर वेबमास्टर अपनी साइट और उस पर मौजूद कॉन्टेंट को कंट्रोल करता है. इसलिए, नतीजों को Google से हटाने या अपडेट करने का सबसे अच्छा तरीका है कि साइट का मालिक (वह साइट जिस पर कॉन्टेंट पब्लिश किया गया हो), यूआरएल को क्रॉल करने की सुविधा ब्लॉक करे, कॉन्टेंट के सोर्स को बदले या पेज को पूरी तरह से हटाए. अगर कॉन्टेंट में बदलाव नहीं किया गया है, तो अगली बार उसे क्रॉल करने पर, वह हमारे खोज के नतीजों में फिर से दिखेगा. जिस साइट का मालिकाना हक आपके पास नहीं है उससे कोई कॉन्टेंट हटाने का पहला चरण है, वेबसाइट के मालिक से संपर्क करना. इसके बाद, उससे वह कॉन्टेंट हटाने या ब्लॉक करने का अनुरोध करें.
हटाया गया या ब्लॉक किया गया कॉन्टेंट
यह मुमकिन है कि वेबसाइट का मालिक किसी पेज को हटा दे. ऐसे में, उस पेज के लिए अनुरोध करने पर, 404 Not Found
रिस्पॉन्स या 410 Gone
रिस्पॉन्स दिखाया जाना चाहिए.
अगर वह पेज को सर्च इंजन से ब्लॉक करने का विकल्प चुनता है, तो ज़रूरी है कि साइट की
robots.txt
फ़ाइल से, पेज की अनुमति
हटाई जाए या पेज में
noindex
meta
टैग शामिल हो.
इनमें से कोई भी शर्त पूरी होने पर, "वेबमास्टर ने पहले ही पेज को ब्लॉक कर दिया है" विकल्प का इस्तेमाल करके, कॉन्टेंट हटाने का अनुरोध सबमिट किया जा सकता है.
कभी-कभी वेबसाइट का मालिक यह दवा करता कि उसने कोई पेज हटा दिया है या उसे ब्लॉक कर दिया है, लेकिन तकनीकी तौर पर उसने ऐसा नहीं किया होता है. अगर वह दावा करता है कि कोई पेज ब्लॉक कर दिया गया है, तो इसकी पुष्टि करने के लिए साइट की robots.txt फ़ाइल देखें. ऐसा करके, यह पता किया जा सकता है कि फ़ाइल में, जिन पेजों के लिए अनुमति हटाई गई है उनकी सूची में, इस पेज को जोड़ा गया है या नहीं.
User-agent: * Disallow: /blocked-page/
किसी पेज को ब्लॉक किया गया है या नहीं, यह पेज के एचटीएमएल सोर्स कोड से भी पता लगाया जा सकता है.
पेज पर जाकर अपने ब्राउज़र से, "पेज का स्रोत देखें" विकल्प चुना जा सकता है. क्या एचटीएमएल head
सेक्शन में, कोई मेटा noindex टैग मौजूद है?
<html> <head> <title>blocked page</title> <meta name="robots" content="noindex"> </head> ...
अगर साइट के मालिक आपको बताते हैं कि पेज हटा दिया गया है, तो एचटीटीपी के जवाब की
जांच करने वाले टूल की मदद से इसकी पुष्टि की जा सकती है. जैसे, Firefox ब्राउज़र के लिए,
लाइव एचटीटीपी हेडर
ऐड-ऑन. इस ऐड-ऑन को चालू करने पर, Firefox में किसी भी यूआरएल से अनुरोध करके,
यह जांच की जा सकती है कि एचटीटीपी का जवाब वाकई में, 404 Not Found
या 410 Gone
है या नहीं.
पेज से हटाया गया कॉन्टेंट
आपको जो कॉन्टेंट हटाना है वह अब पेज पर मौजूद नहीं है, इसकी पुष्टि करने के बाद, 'कॉन्टेंट को पेज से हटा दिया गया' विकल्प का इस्तेमाल करके, कैश मेमोरी हटाने का अनुरोध किया जा सकता है. कॉन्टेंट हटाने के इस तरीके को आम तौर पर, "कैश मेमोरी" हटाना कहा जाता है. इससे, यह पक्का हो जाता है कि Google के खोज नतीजों में, कैश मेमोरी में सेव की गई, पेज की कॉपी या वर्शन या पेज के पुराने वर्शन से टेक्स्ट का कोई भी स्निपेट शामिल नहीं होगा. सिर्फ़ अपडेट किए गए मौजूदा पेज (जिस पर हटाया गया कॉन्टेंट मौजूद नहीं है) को Google के खोज के नतीजों से ऐक्सेस किया जा सकेगा. हालांकि, अपडेट किए गए मौजूदा पेज को अब भी, पुराने कॉन्टेंट से जुड़े शब्द खोजने पर रैंक किया जा सकता है. ऐसा इसलिए, क्योंकि बाहरी साइटों पर अब भी कुछ ऐसे लिंक मौजूद हैं जो पेज पर लेकर आते हैं. कैश मेमोरी हटाने के अनुरोधों के लिए, आपसे "पेज से हटाया गया शब्द" डालने के लिए कहा जाएगा. पक्का करें कि आपने ऐसा शब्द डाला हो जो मौजूदा लाइव पेज पर मौजूद न हो. इससे हमारी अपने-आप होने वाली प्रोसेस, यह पुष्टि कर सकेगी कि पेज बदल गया है. ऐसा न होने पर, अनुरोध अस्वीकार कर दिया जाएगा. कैश मेमोरी हटाने के तरीकों के बारे में ज़्यादा जानकारी के लिए, "यूआरएल हटाने के बारे में जानकारी" सीरीज़ का दूसरा भाग देखें.
सेफ़ सर्च की सुविधा से फ़िल्टर किए गए नतीजों में दिखने वाले आपत्तिजनक वेबपेज या इमेज हटाना
Google ने SafeSearch फ़िल्टर लॉन्च किया है, ताकि खोज के ऐसे नतीजे दिखाए जा सकें जिनमें आपत्तिजनक कॉन्टेंट शामिल न हो. अगर आपको ऐसा कॉन्टेंट मिलता है जिसे आपके मुताबिक, सेफ़ सर्च की सुविधा की मदद से फ़िल्टर किया जाना चाहिए था, तो भविष्य में ऐसे कॉन्टेंट को, सेफ़ सर्च की सुविधा से फ़िल्टर करके दिखाए जा रहे नतीजों से हटाने का अनुरोध किया जा सकता है. 'सेफ़ सर्च से फ़िल्टर किए गए हमारे नतीजों में आपत्तिजनक कॉन्टेंट दिखता है' विकल्प का इस्तेमाल करके, कॉन्टेंट हटाने का अनुरोध सबमिट करें.
यूआरएल हटाने वाले सार्वजनिक टूल में कोई समस्या आ रही है या आपको कोई सवाल पूछना है, तो कृपया उन्हें वेबमास्टर सहायता फ़ोरम में पोस्ट करें या हमारे सहायता केंद्र में जाकर कॉन्टेंट हटाने से जुड़े निर्देशों की पूरी जानकारी देखें. फ़ोरम पर पोस्ट करते समय, अगर आपको उस कॉन्टेंट के लिंक शेयर करने हैं जिसे आपको हटवाना है, तो यूआरएल को छोटा करने की सेवा का इस्तेमाल करना न भूलें.
इस सीरीज़ की अन्य पोस्ट
- पहला भाग: यूआरएल और डायरेक्ट्री हटाना
- दूसरा भाग: कैश मेमोरी में सेव किया गया कॉन्टेंट हटाना और अपडेट करना
- तीसरा भाग: ऐसा कॉन्टेंट हटाना जिस पर आपका मालिकाना हक नहीं है
- चौथा भाग: अनुरोधों को ट्रैक करना, देखना कि कौनसे यूआरएल नहीं हटाने हैं
आखिर में, हो सकता है कि आप अपने बारे में ऑनलाइन उपलब्ध जानकारी को मैनेज करने के बारे में पढ़ना चाहें.