Google के लिए यूआरएल स्ट्रक्चर डिज़ाइन करने के सबसे सही तरीके
Google पर, आरएफ़सी 3986 के मुताबिक यूआरएल का इस्तेमाल किया जा सकता है. इस स्टैंडर्ड के तहत रिज़र्व किए गए वर्णों को पर्सेंट कोड में बदला जाना चाहिए. रिज़र्व नहीं किए गए ASCII वर्णों को, बिना कोड में बदले गए फ़ॉर्मैट में छोड़ा जा सकता है. इसके अलावा, गैर-ASCII रेंज के वर्णों को UTF-8 कोड में बदला जाना चाहिए.
जहां भी हो सके, अपने यूआरएल में लंबे आईडी नंबर के बजाय, पढ़ने में आसान शब्दों का इस्तेमाल करें.
इसका सुझाव दिया जाता है: यूआरएल में आसान और जानकारी देने वाले शब्दों का इस्तेमाल करें:
https://en.wikipedia.org/wiki/Aviation
इसका सुझाव दिया जाता है: अगर हो सके, तो यूआरएल में स्थानीय भाषा के शब्दों का इस्तेमाल करना.
https://www.example.com/lebensmittel/pfefferminz
इसका सुझाव दिया जाता है: ज़रूरत के हिसाब से, UTF-8 एन्कोडिंग का इस्तेमाल करना. जैसे, इस उदाहरण में, यूआरएल में मौजूद ऐरेबिक वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://www.example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9
इस उदाहरण में, यूआरएल में मौजूद चाइनीज़ वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7
इस उदाहरण में, यूआरएल में मौजूद ऊमलाउट वर्णों के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://www.example.com/gem%C3%BCse
इस उदाहरण में, यूआरएल में मौजूद इमोजी के लिए, UTF-8 एन्कोडिंग का इस्तेमाल किया गया है:
https://example.com/%F0%9F%A6%99%E2%9C%A8
इसका सुझाव नहीं दिया जाता: यूआरएल में, बिना ASCII वाले वर्णों का इस्तेमाल करना:
https://www.example.com/نعناع
https://www.example.com/杂货/薄荷
https://www.example.com/gemüse
https://www.example.com/🦙✨
इसका सुझाव नहीं दिया जाता: यूआरएल में, पढ़े नहीं जा सकने वाले, लंबे आईडी नंबर का इस्तेमाल करना:
https://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1
आम तौर पर, फ़्रैगमेंट यूआरएल के साथ Google काम नहीं करता. इसलिए, किसी वेबपेज में मौजूद कॉन्टेंट को बदलने के लिए फ़्रैगमेंट का इस्तेमाल न करें. अगर आपने कॉन्टेंट बदलने के लिए JavaScript का इस्तेमाल किया है, तो इसके बजाय History API का इस्तेमाल करें.
इसका सुझाव नहीं दिया जाता: फ़्रैगमेंट यूआरएल:
https://example.com/#/potatoes
अगर आपकी साइट कई इलाकों में उपलब्ध है, तो ऐसे यूआरएल का इस्तेमाल करें जिनकी मदद से, आपकी साइट अलग-अलग इलाकों के उपयोगकर्ताओंं को टारगेट कर सके. यूआरएल को स्ट्रक्चर करने से जुड़े और उदाहरण देखने के लिए, अलग-अलग इलाकों के हिसाब से बनाए गए यूआरएल इस्तेमाल करना लेख देखें.
इसका सुझाव दिया जाता है: देश के हिसाब से डोमेन इस्तेमाल करें:
https://example.de
इसका सुझाव दिया जाता है: देश के हिसाब से, gTLD वाली सबडायरेक्ट्री इस्तेमाल करना:
https://example.com/de/
अपने यूआरएल में शब्दों को अलग-अलग करने के लिए, हाइफ़न का इस्तेमाल करें. इससे लोग और सर्च इंजन, यूआरएल में मौजूद कीवर्ड ज़्यादा आसानी से समझ पाते हैं. हमारा सुझाव है कि आप अपने यूआरएल में, अंडरस्कोर (_
)
के बजाय, हाइफ़न (-
) का इस्तेमाल करें.
इसका सुझाव दिया जाता है: हाइफ़न (-
) का इस्तेमाल करना:
https://www.example.com/summer-clothing/filter?color-profile=dark-grey
इसका सुझाव नहीं दिया जाता: अंडरस्कोर (_
) का इस्तेमाल करना:
https://www.example.com/summer_clothing/filter?color_profile=dark_grey
इसका सुझाव नहीं दिया जाता: यूआरएल में मौजूद कीवर्ड को एक साथ लिखना:
https://www.example.com/greendress
यूआरएल से जुड़ी सामान्य समस्याएं
ज़्यादा मुश्किल स्ट्रक्चर वाले यूआरएल से क्रॉलर को परेशानी हो सकती है, क्योंकि ये यूआरएल आपकी साइट के लिए ऐसे कई यूआरएल बना देते हैं जो एक जैसा या मिलता-जुलता कॉन्टेंट ही दिखाते हैं. इनमें, खास तौर पर ऐसे यूआरएल शामिल हैं जिनमें एक से ज़्यादा पैरामीटर का इस्तेमाल किया जाता है. इस वजह से हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ का इस्तेमाल करे. इसके अलावा, आपकी साइट के पूरे कॉन्टेंट को पूरी तरह इंडेक्स न कर पाए.
बेवजह बहुत सारे यूआरएल बनने की कई वजहें हो सकती हैं. इनमें से आम वजह यहां दी गई हैं:
- एक आइटम सेट के लिए कई फ़िल्टर इस्तेमाल करना. कई साइटें, एक ही आइटम सेट या
खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. कई मामलों में उपयोगकर्ता, दिए गए पैरामीटर के हिसाब
से आइटम सेट के लिए फ़िल्टर का इस्तेमाल भी कर सकते हैं. फ़िल्टर के लिए, पहले से तय कुछ विकल्प भी दिए गए होते हैं (उदाहरण के लिए, ऐसे होटल दिखाओ जो समुद्र के किनारे हैं).
इसके अलावा, जब कई फ़िल्टर एक साथ इस्तेमाल किए जाते हैं (उदाहरण के लिए, ऐसे होटल जो समुद्र के किनारे हैं और उनमें फ़िटनेस सेंटर भी है), तो
साइटों में यूआरएल की संख्या (डेटा को देखे जाने की संख्या) अचानक बढ़ जाती है. थोड़े-बहुत अंतर की वजह से
होटल के लिए अलग-अलग सूचियां बनाना ज़रूरी नहीं है, क्योंकि Googlebot सिर्फ़ कुछ ही सूचियां देखता है और
वह उनसे हर होटल के पेज पर पहुंच सकता है. उदाहरण के लिए:
- "किफ़ायती दरों" पर होटल:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461
- समुद्र के किनारे "किफ़ायती दरों" पर होटल:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
- समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर के साथ होटल:
https://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
- "किफ़ायती दरों" पर होटल:
- डाइनैमिक तरीके से दस्तावेज़ बनाना. इससे काउंटर, टाइमस्टैंप या विज्ञापनों की वजह से थोड़े-बहुत बदलाव हो सकते हैं.
- यूआरएल में समस्या पैदा करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी बड़ी संख्या में डुप्लीकेट और बहुत सारे यूआरएल बना सकते हैं.
-
पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम
से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. जैसे:
https://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance&search_category=25
- यूआरएल में ऐसे पैरामीटर का होना जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. उदाहरण के लिए:
https://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=OPD+Product+Page&cat=79
https://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
https://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
- कैलेंडर से जुड़ी समस्याएं. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों की सीमा तय किए बिना,
पिछली और आने वाली तारीखों के लिए लिंक बना सकता है. उदाहरण के लिए:
https://www.example.com/calendar.php?d=13&m=8&y=2011
- किसी विषय से मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से इंफ़ाइनाइट स्पेस बन सकता है. यह समस्या पाथ एलिमेंट को बार-बार दोहराने की वजह से आती है. उदाहरण के लिए:
https://www.example.com/index.shtml/discuss/category/school/061121/html/interview/category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
यूआरएल से जुड़ी समस्याओं को ठीक करना
यूआरएल स्ट्रक्चर से जुड़ी संभावित समस्याओं से बचने के लिए, हम आपको ये तरीके अपनाने का सुझाव देते हैं:
- यूआरएल का आसान स्ट्रक्चर बनाएं. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें.
- ऐसे यूआरएल जिनमें समस्या आ रही है, उनमें robots.txt फ़ाइल का इस्तेमाल करें, ताकि Googlebot उन्हें ऐक्सेस न कर सके. खास तौर पर, डाइनैमिक यूआरएल ब्लॉक करें. उदाहरण के लिए, खोज के नतीजे तैयार करने वाले यूआरएल या असीमित खाली जगह बनाने वाले यूआरएल, जैसे कि कैलेंडर. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करें. ऐसा करके, आसानी से बहुत सारे यूआरएल ब्लॉक किए जा सकते हैं.
- जहां भी हो सके, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इनके बजाय, कुकी का इस्तेमाल करें.
- अगर वेब सर्वर किसी यूआरएल में मौजूद बड़े और छोटे अक्षरों वाले टेक्स्ट को एक ही तरीके से देखता है, तो पूरे टेक्स्ट को एक ही तरह के अक्षरों (बड़े या छोटे) में बदलें. इससे, Google के लिए यह तय करना आसान हो जाता है कि यूआरएल उपयोगकर्ता को एक ही पेज पर ले जाते हैं.
- जहां भी हो सके, गै़र-ज़रूरी पैरामीटर की काट-छांट करके यूआरएल को छोटा करें.
-
अगर आपकी साइट में ऐसा कैलेंडर है जिसमें शुरू और खत्म होने की तारीख मौजूद नहीं है, तो आने वाले समय के लिए डाइनैमिक तरीके से बनाए गए कैलेंडर पेजों के लिंक में एक
nofollow
एट्रिब्यूट जोड़ें. - अपनी साइट पर काम न करने वाले मिलते-जुलते लिंक देखें.