छिपाई गई जानकारी को Google Search के नतीजों में दिखने से रोकना

वेब पर दस्तावेज़ और इमेज पब्लिश करते समय, हो सकता है कि आपसे अनजाने में कोई ऐसी जानकारी पब्लिश हो जाए जो तुरंत और साफ़-साफ़ नज़र न आए. खास तौर पर, ऐसी जानकारी जो शायद आपको न दिखे या जिसे छिपाने के लिए बदला गया हो. हो सकता है कि वह जानकारी, दस्तावेज़ के कुछ फ़ॉर्मैट में शामिल हो और सर्च इंजन में उसे देखा जा सकता हो.

सर्च इंजन, वेब पर सबके लिए उपलब्ध कॉन्टेंट और दस्तावेज़ो को इंडेक्स करते हैं. इनमें इस तरह का कॉन्टेंट और इमेज शामिल होती हैं जिन्हें पूरी तरह छिपाने के लिए बदला नहीं गया होता. इस वजह से, उन्हें सर्च इंजन में ढूंढा जा सकता है. स्क्रीन रीडर जैसी सहायक टेक्नोलॉजी की मदद से, इस तरह के "छिपाए गए" कॉन्टेंट को आसानी से ऐक्सेस किया जा सकता है. इसी तरह, इमेज पहचानने के लिए, ऑप्टिकल कैरेक्टर रिकग्निशन (ओसीआर) जैसी आम तौर पर इस्तेमाल होने वाली तकनीकों की मदद से, इस तरह के कॉन्टेंट को आसानी से खोजा जा सकता है.

टेक्स्ट का फ़ॉन्ट बहुत छोटा कर देने, टेक्स्ट के लिए भी बैकग्राउंड का ही रंग इस्तेमाल करने या टेक्स्ट को इमेज से ढक देने से, हो सकता है कि लोगों को इस तरह की जानकारी साफ़-साफ़ नज़र न आएं. हालांकि, ये तरीके भी कॉन्टेंट में मौजूद संवेदनशील जानकारी को छुपाने में इतने कारगर नहीं होते कि सर्च इंजन इस तरह की जानकारी वाले दस्तावेज़ों, इमेज या कॉन्टेंट को इंडेक्स न कर पाएं और ढूंढने लायक न बना सकें.

इसी तरह, कुछ खास तरह के दस्तावेज़ों में जानकारी कई रूप में शामिल रहती है, जो तुरंत नहीं दिखती. इस जानकारी में, दस्तावेज़ में हुए बदलावों का इतिहास शामिल हो सकता है. इसकी वजह से, छिपाने के लिए बदले गए या किसी और वजह से बदले गए टेक्स्ट को उपयोगकर्ता देख सकते हैं. इस जानकारी में, काटे जाने से पहले की पूरी इमेज या इमेज की ऐसी जानकारी शामिल हो सकती है जिसे बदलाव करके छिपाया गया हो. इस जानकारी में, किसी फ़ाइल का ऐसा मेटाडेटा भी शामिल हो सकता है जो तुरंत नहीं दिखता. जैसे: फ़ाइल को ऐक्सेस करने वाले या उसमें बदलाव करने वाले लोगों के नाम की सूची.

यहां तक कि किसी दस्तावेज़ को एक्सपोर्ट करने या उसका फ़ॉर्मैट बदलने के बाद भी, यह जानकारी सर्च इंजन में सेव रह सकती है. अगर आपको किसी फ़ाइल से कोई जानकारी हटानी है, तो यह ज़रूरी है कि फ़ाइल को सार्वजनिक करने से पहले, उस जानकारी को पूरी तरह हटा दिया जाए.

अपने दस्तावेज़ों को Google Search में इंडेक्स करने और खोजे जाने से रोकने के लिए, यहां बताए गए सबसे सही तरीके पढ़ें. यहां, जानकारी को छिपाने के लिए ठीक से बदलाव करने के बारे में बताया गया है.

दस्तावेज़ में जोड़ने से पहले, इमेज में बदलाव करना और उन्हें एक्सपोर्ट करना

Google Search पर खोज के नतीजों में, पूरे वेब पर मौजूद इमेज दिखती हैं, चाहे इमेज किसी वेब पेज पर मौजूद हों या अलग-अलग तरह के दस्तावेज़ों में जोड़ी गई हों. कभी-कभी, दस्तावेज़ में जोड़ी गई इमेज में बदलाव किया जाता है. यह बदलाव, सिर्फ़ उन टूल की मदद से किया जाता है जिनका इस्तेमाल करके उस दस्तावेज़ को बनाया गया है. इस वजह से, जब इमेज को अलग से इंडेक्स किया जाता है, तो जिस जानकारी को छिपाने के लिए उसमें बदलाव किया गया था वह जानकारी छिप नहीं पाती. इसलिए, सबसे अच्छा तरीका यह है कि इमेज को किसी दस्तावेज़ में जोड़ने से पहले ही उसमें बदलाव कर लिया जाए, न कि बाद में. खास तौर पर:

  • दस्तावेज़ों में जोड़ने से पहले, इमेज से अनचाही जानकारी काटकर हटा दें. अगर आप, सबके लिए उपलब्ध किसी दस्तावेज़ में बदलाव करते हैं, तो टूल में बदलाव करने से पहले की जानकारी सेव रह जाती है. जैसे, अगर आप वर्ड प्रोसेसर या स्लाइड बनाने वाले किसी टूल की मदद से किसी दस्तावेज़ में जोड़ी गई इमेज को काटते हैं, तो टूल में पूरी इमेज सेव रह जाती है. इसलिए, टूल के इस्तेमाल से जुड़ी जानकारी अच्छी तरह पढ़ लें.
  • इमेज में शामिल टेक्स्ट या कोई हिस्सा सबको ना दिखे, इसके लिए उसे पूरी तरह हटा दें या धुंधला कर दें. ऐसा इसलिए, क्योंकि ओसीआर सिस्टम इन इमेज में शामिल टेक्स्ट को खोजे जाने वाले टेक्स्ट में दिखा सकते हैं.
  • अनचाहा मेटाडेटा हटाएं.

इस दस्तावेज़ में दिए गए सुझावों के मुताबिक बदलाव करने के बाद, अपडेट की गई इमेज को PNG या WebP जैसे बिना वेक्टर वाले या इमेज को फ़्लैट करने वाले फ़ाइल फ़ॉर्मैट में एक्सपोर्ट या सेव करें. इससे, इमेज के छिपाए गए हिस्सों को अनजाने में किसी सार्वजनिक दस्तावेज़ में शामिल होने से रोका जा सकता है.

जिस फ़ाइल फ़ॉर्मैट में कॉन्टेंट को सार्वजनिक करना है उसमें बदलने से पहले, अनचाहे टेक्स्ट में बदलाव करना या उसे हटाना

सार्वजनिक दस्तावेज़ जनरेट करने से पहले, ऐसे हर टेक्स्ट को हटा दें जिसे आपको फ़ाइल के आखिरी वर्शन में नहीं दिखाना है. सार्वजनिक करने के लिए फ़ाइल का ऐसा फ़ॉर्मैट चुनें जिसमें बदलाव का इतिहास सेव नहीं होता. यहां कुछ और खास सलाह दी गई है:

  • अगर किसी फ़ाइल में ऐसी जानकारी है जिसे छिपाने की ज़रूरत है, तो दस्तावेज़ की जानकारी को छिपाने के लिए बदलाव करने वाले सही टूल का इस्तेमाल करें. उदाहरण के लिए, टेक्स्ट को छिपाने के लिए उसे काले रंग की पट्टी से न ढकें, क्योंकि ऐसा करने पर हो सकता है कि टेक्स्ट, सार्वजनिक दस्तावेज़ में शामिल रहे.
  • सार्वजनिक फ़ाइल में दस्तावेज़ के मेटाडेटा की दोबारा जांच कर लें.
  • आपको फ़ाइल को जिस फ़ॉर्मैट (जैसे कि PDF, इमेज वगैरह) में सार्वजनिक करना है उस फ़ॉर्मैट के हिसाब से, दस्तावेज़ की जानकारी छिपाने के लिए बदलाव करने के सबसे सही तरीके आज़माएं.
  • यूआरएल या फ़ाइल के नाम में शामिल जानकारी पर ध्यान दें. अगर किसी वेबसाइट के कुछ पेजों को robots.txt की मदद से, क्रॉल होने से रोका गया है, तब भी Search में उन सभी यूआरएल को इंडेक्स किया जा सकता है, भले ही उन्हें कॉन्टेंट के बिना इंडेक्स किया जाए. ईमेल पतों या नामों के बजाय, यूआरएल पैरामीटर में हैश का इस्तेमाल करें.
  • जानकारी छिपाने के लिए बदले गए कॉन्टेंट के ऐक्सेस को सीमित करने के लिए, पुष्टि करने की प्रक्रिया का इस्तेमाल करें. इसके बाद, लॉग इन पेज को इंडेक्स होने से रोकने के लिए, noindex रोबोट मेटा टैग का इस्तेमाल करें.
  • पब्लिश करते समय, पक्का करें कि वेबसाइट की Google Search Console में पुष्टि हो चुकी है. इससे, जब भी ज़रूरत हो, तब जानकारी तुरंत हटाई जा सकती है.
  1. लाइव दस्तावेज़ को उस वेबसाइट या जगह से हटाएं जहां आपने उसे पब्लिश किया था.
  2. पुष्टि की गई साइट पर दस्तावेज़ों को Search से हटाने के लिए, यूआरएल हटाने वाले टूल का इस्तेमाल करें. अगर आपको कई दस्तावेज़ हटाने हैं, तो यूआरएल प्रीफ़िक्स का इस्तेमाल करें. आम तौर पर, पुष्टि की गई साइटों से एक दिन के अंदर यूआरएल हटा दिए जाते हैं. इससे, हटाया जाने वाला दस्तावेज़, छिपाने के लिए बदले गए कॉन्टेंट की किसी भी खोज में नहीं दिखता है.
  3. छिपाने के लिए अच्छी तरह से बदलाव किए गए दस्तावेज़ को अलग यूआरएल के तहत होस्ट करें. इससे यह पक्का होता है कि इंडेक्स किया गया कोई नया वर्शन, किसी नए दस्तावेज़ का है, न कि उस दस्तावेज़ का कोई पुराना वर्शन है. (ऐसा इसलिए है, क्योंकि यूआरएल को फिर से क्रॉल करने में और खोज इंडेक्स में अपडेट करने में, थोड़ा समय लग सकता है). ऐसे दस्तावेज़ों के किसी भी लिंक को अपडेट करें.
  4. ऐसी किसी दूसरी साइट से संपर्क करें जो छिपाने के लिए गलत तरीके से बदलाव किए गए दस्तावेज़ों को भी होस्ट करती हो. साथ ही, उसे इन्हें हटाने के लिए भी कहें. साइट को उसके Search Console खाते में यूआरएल हटाने वाले टूल का इस्तेमाल करने के लिए कहें या आप पुराना कॉन्टेंट हटाने वाला टूल इस्तेमाल करके, Google के सिस्टम को, खोज के नतीजे अपडेट करने के लिए कह सकते हैं.
  5. यूआरएल हटाने के अनुरोधों की समयसीमा खत्म होने दें. यह समयसीमा, Google Search इंडेक्स में यूआरएल अपडेट होने के बाद या करीब छह महीने बाद खत्म होती है.