क्रॉलिंग दिसंबर: वेबसाइट पर फ़िल्टर लगाकर खोजना

मंगलवार, 17 दिसंबर, 2024

हमने अभी-अभी वेबसाइट पर फ़िल्टर लगाकर खोजने के सबसे सही तरीकों के बारे में एक नया दस्तावेज़ पब्लिश किया है. इसे मूल रूप से ब्लॉग पोस्ट के तौर पर पब्लिश किया गया था. यहां दस्तावेज़ वाले नए पेज के कुछ अहम हिस्सों के बारे में खास जानकारी दी गई है.

वेबसाइट पर फ़िल्टर लगाकर खोजना, उपयोगकर्ताओं को आपकी साइट पर अपनी ज़रूरत की चीज़ें ढूंढने में मदद करने का एक बेहतरीन तरीका है. हालांकि, अगर इसे ध्यान से लागू नहीं किया जाता है, तो इससे एसईओ के लिए समस्याएं आ सकती हैं. क्यों? ऐसा इसलिए, क्योंकि यह अनगिनत यूआरएल जनरेट कर सकता है. इसकी वजह से:

  • ज़रूरत से ज़्यादा क्रॉल करना: सर्च इंजन ऐसे अनगिनत यूआरएल को क्रॉल करने में समय बर्बाद करते हैं जो खोज के लिए उपयोगकर्ताओं के लिए काम के नहीं होते.
  • कॉन्टेंट को खोजने में ज़्यादा समय लगना: कॉन्टेंट को ज़्यादा क्रॉल करने से, आपके अहम और नए कॉन्टेंट को खोजने में ज़्यादा समय लगता है.

असल में, वेबसाइट पर फ़िल्टर लगाकर खोजने की वजह से, साइट के मालिकों को अक्सर ज़्यादा क्रॉल करने से जुड़ी समस्याओं की शिकायत मिलती है. ज़्यादातर मामलों में, कुछ सबसे सही तरीकों का पालन करके इस समस्या से बचा जा सकता है. हालांकि, पहले हम इसके बारे में जानते हैं.

यूआरएल से जुड़ी समस्या

वेबसाइट पर फ़िल्टर लगाकर खोजने में हर फ़िल्टर कॉम्बिनेशन, आम तौर पर एक यूनीक यूआरएल बनाता है. उदाहरण के लिए:

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

product, color या size जैसे किसी भी पैरामीटर को बदलने पर, एक नया यूआरएल बनता है. इससे यूआरएल की संख्या बहुत ज़्यादा हो सकती है. यही समस्या है: ऐसे अनगिनत नए यूआरएल हैं जिन्हें खोजा जाना बाकी है. चलिए, इसे ठीक करते हैं.

दो तरीके

  1. वेबसाइट पर फ़िल्टर लगाकर खोजने वाले यूआरएल ब्लॉक करना:
    • अगर आपको इन यूआरएल को इंडेक्स नहीं कराना है, तो क्रॉल करने से रोकने के लिए robots.txt का इस्तेमाल करें.
    • इसके अलावा, फ़िल्टर के लिए यूआरएल फ़्रैगमेंट (#) का इस्तेमाल करें, क्योंकि सर्च इंजन आम तौर पर उन्हें अनदेखा कर देते हैं.
  2. वेबसाइट पर फ़िल्टर लगाकर खोजने वाले यूआरएल को ऑप्टिमाइज़ करें (अगर आपको उन्हें क्रॉल करना है, तो कोई फ़र्क़ नहीं पड़ता कि इसके लिए आपको कितना खर्च करना पड़ता है):
    • यूआरएल पैरामीटर के लिए, स्टैंडर्ड & सेपरेटर का इस्तेमाल करें. 💩 पैरामीटर को अलग करने के लिए अच्छा वर्ण नहीं है.
    • यूआरएल पाथ में फ़िल्टर का क्रम एक जैसा रखें.
    • बिना किसी नतीजे वाले फ़िल्टर कॉम्बिनेशन के लिए, 404 स्टेटस कोड दिखाएं.
    • अगर आपके पास कोई दूसरा विकल्प नहीं है, तो खोज के नतीजों में कोई नतीजा न मिलने पर, उपयोगकर्ताओं को "नहीं मिला" वाले सामान्य पेज पर रीडायरेक्ट करने से बचें. उदाहरण के लिए, ऐसा तब किया जा सकता है, जब आपका ऐप्लिकेशन एक पेज का हो.

विचार करने वाली ज़रूरी बातें

  • rel="canonical" का इस्तेमाल करके भी, वैरिएंट को मुख्य पेज पर ले जाकर, सिग्नल को एक साथ इकट्ठा करने में भी मदद मिलती है. इसे प्रोसेस होने में समय लगता है.
  • फ़िल्टर किए गए लिंक पर rel="nofollow" का इस्तेमाल करने से, क्रॉल करने में रुकावट आ सकती है. हालांकि, इसे लगातार लागू करना ज़रूरी है. जैसे, इन पेजों पर ले जाने वाले हर लिंक, चाहे वह इंटरनल हो या बाहरी, में rel="nofollow" एट्रिब्यूट होना चाहिए.
  • वेबसाइट पर फ़िल्टर लगाकर खोजने वाले यूआरएल को क्रॉल करने पर, हमेशा सर्वर के रिसॉर्स का इस्तेमाल होगा. इससे, नए कॉन्टेंट को खोजने पर असर पड़ सकता है.

अगर आपके पास वेबसाइट पर फ़िल्टर लगाकर खोजने के सबसे सही तरीकों के बारे में नया दस्तावेज़ का सुझाव है या आपको इस बारे में ज़्यादा जानकारी चाहिए, तो उस दस्तावेज़ पर मौजूद सुझाव, शिकायत या राय वाले टूल का इस्तेमाल करें. अगर आपको वेबसाइट पर फ़िल्टर लगाकर खोजने में दिलचस्पी है और आपको इस बारे में दूसरों के साथ बातचीत करनी है, तो Search Central की कम्यूनिटी पर जाएं. हालांकि, हम LinkedIn पर भी उपलब्ध हैं.


क्या आपको क्रॉल करने के बारे में ज़्यादा जानना है? 'क्रॉलिंग दिसंबर' सीरीज़ की पूरी जानकारी देखें: