यूआरएल की बनावट (स्ट्रक्चर) आसान रखना

किसी साइट का यूआरएल जितना हो सके उतना आसान होना चाहिए. अपने कॉन्टेंट को व्यवस्थित करें, ताकि यूआरएल सही तरीके से बनाए जा सकें और लोग इन्हें आसानी से समझ सकें (जब संभव हो, तब लंबे आईडी नंबर के बजाय पढ़ने में आसान शब्द शामिल करें). उदाहरण के लिए, अगर आप एविएशन के बारे में जानकारी ढूंढ रहे हैं, तो http://en.wikipedia.org/wiki/Aviation जैसा कोई यूआरएल यह तय करने में आपकी मदद करेगा कि उस लिंक पर क्लिक करना है या नहीं. http://www.example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 जैसे किसी यूआरएल पर उपयोगकर्ताओं का ध्यान कम जाएगा.

अपने यूआरएल में विराम चिह्न का इस्तेमाल करें. हमारे लिएhttp://www.example.com/greendress.html के बजाय, http://www.example.com/green-dress.html ज़्यादा उपयोगी यूआरएल है. हमारा सुझाव है कि आप अपने यूआरएल में अंडरस्कोर (_) के बजाय, हाइफ़न (-) का इस्तेमाल करें.

ज़्यादा मुश्किल, खासकर एक से ज़्यादा पैरामीटर वाले यूआरएल, आपकी साइट पर बेवजह बहुत सारे यूआरएल बना सकते हैं. ये सभी यूआरएल एक जैसा या मिलता-जुलता कॉन्टेंट दिखाकर, क्रॉलर को परेशान कर सकते हैं. इसलिए, हो सकता है कि Googlebot ज़रूरत से ज़्यादा बैंडविड्थ इस्तेमाल करे या आपकी साइट का सारा कॉन्टेंट पूरी तरह इंडेक्स न कर पाए.

इस समस्या की आम वजहें

बेवजह बहुत सारे यूआरएल होने की कई वजहें हो सकती हैं. इनमें ये वजहें शामिल हैं:

  • कुछ आइटम के लिए अतिरिक्त फ़िल्टर लगाना कुछ साइटें एक ही आइटम सेट या खोज के नतीजों को अलग-अलग तरीके से दिखाती हैं. यह अक्सर उपयोगकर्ताओं को पहले से तय शर्तों के मुताबिक, इस सेट को फ़िल्टर करने की अनुमति देती हैं (उदाहरण के लिए: मुझे ऐसे होटल दिखाओ जो समुद्र के किनारे हैं). जब फ़िल्टर को किसी और तरीके से एक साथ लगाया जाता है (उदाहरण के लिए: समुद्र के किनारे होटल और फ़िटनेस सेंटर के साथ), तो साइट में यूआरएल की संख्या (डेटा के देखे जाने की संख्या) अचानक बढ़ जाती है. बड़ी संख्या में होटल की अलग सूची बनाने की ज़रूरत नहीं है, क्योंकि Googlebot को हर एक होटल के पेज तक पहुंचने के लिए सिर्फ़ कुछ सूचियों को देखने की ज़रूरत होती है. उदाहरण के लिए:
    • "किफ़ायती दरों" पर होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461
    • समुद्र के किनारे "किफ़ायती दरों" पर होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240
    • समुद्र के किनारे "किफ़ायती दरों" पर और फ़िटनेस सेंटर वाले होटल:
      http://www.example.com/hotel-search-results.jsp?Ne=292&N=461+4294967240+4294967270
  • दस्तावेज़ों को डाइनैमिक तरीके से जनरेट करना. इससे काउंटर, टाइमस्टैंप या विज्ञापन से जुड़े थोड़े-बहुत बदलाव हो सकते हैं.
  • यूआरएल में गड़बड़ी करने वाले पैरामीटर. उदाहरण के लिए, सेशन आईडी से भारी मात्रा में डुप्लीकेट कॉन्टेंट और बहुत सारे यूआरएल बन सकते हैं.
  • पैरामीटर क्रम से लगाना. कुछ बड़ी शॉपिंग साइटों पर एक ही तरह के आइटम को क्रम से लगाने के कई तरीके होते हैं, जिससे बहुत सारे यूआरएल बन जाते हैं. उदाहरण के लिए:
    http://www.example.com/results?search_type=search_videos&search_query=tpb&search_sort=relevance
       &search_category=25
  • यूआरएल में ऐसे पैरामीटर जो काम के नहीं हैं, जैसे कि रेफ़रल पैरामीटर. उदाहरण के लिए:
    http://www.example.com/search/noheaders?click=6EE2BF1AF6A3D705D5561B7C3564D9C2&clickPage=
       OPD+Product+Page&cat=79
    http://www.example.com/discuss/showthread.php?referrerid=249406&threadid=535913
    http://www.example.com/products/products.asp?N=200063&Ne=500955&ref=foo%2Cbar&Cn=Accessories.
  • कैलेंडर से जुड़ी गड़बड़ियां. डाइनैमिक तौर पर बनाया गया कैलेंडर, शुरू या खत्म होने की तारीखों पर बिना प्रतिबंध लगाए, पिछली और आने वाली तारीखों के लिए लिंक जनरेट कर सकता है. उदाहरण के लिए:
    http://www.example.com/calendar.php?d=13&m=8&y=2011
    http://www.example.com/calendar/cgi?2008&month=jan
  • मिलते-जुलते ऐसे लिंक जो काम नहीं करते हैं. काम न करने वाले मिलते-जुलते लिंक से यूआरएल में असीमित खाली जगह बन सकती है. यह समस्या पाथ एलिमेंट के बार-बार दोहराने की वजह से आती है. उदाहरण के लिए:
    http://www.example.com/index.shtml/discuss/category/school/061121/html/interview/
      category/health/070223/html/category/business/070302/html/category/community/070413/html/FAQ.htm
इस समस्या को ठीक करने का तरीका

हमारा सुझाव है कि यूआरएल बनाने में होने वाली समस्याओं से बचने के लिए, आप ये तरीके अपनाएं:

  • ऐसे यूआरएल जिनमें समस्या आ रही है उन पर Googlebot के ऐक्सेस को ब्लॉक करने के लिए robots.txt फ़ाइल का इस्तेमाल करें. आपको खास तौर पर खोज के नतीजे जनरेट करने वाले यूआरएल, जैसे डाइनैमिक यूआरएल या कैलेंडर जैसे असीमित खाली जगह बनाने वाले यूआरएल को ब्लॉक करना चाहिए. अपनी robots.txt फ़ाइल में रेगुलर एक्सप्रेशन का इस्तेमाल करके, आप आसानी से बहुत सारे यूआरएल ब्लॉक कर सकते हैं.
  • जब भी संभव हो, यूआरएल में सेशन आईडी के इस्तेमाल से बचें. इसके बजाय, कुकी का इस्तेमाल करें. ज़्यादा जानकारी के लिए, हमारी वेबमास्टर गाइडलाइन देखें.
  • जब भी संभव हो, गै़र-ज़रूरी पैरामीटर को काट-छांट कर यूआरएल को छोटा करें.
  • अगर आपकी साइट में इंफ़ाइनाइट कैलेंडर है, तो डाइनैमिक तरीके से आने वाले समय के लिए बनाए गए कैलेंडर पेज में एक nofollow एट्रिब्यूट जोड़ें.
  • देखें कि आपकी साइट पर काम न करने वाले मिलते-जुलते लिंक हैं या नहीं.