साइटमैप बनाना और उसे सबमिट करना

इस पेज पर साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. अगर आपको साइटमैप के बारे में ज़्यादा जानकारी नहीं है, तो सबसे पहले हमारी गाइड पढ़ें.

Google, साइटमैप प्रोटोकॉल के हिसाब से बताए गए फ़ॉर्मैट के साथ काम करता है. हर फ़ॉर्मैट के अपने फ़ायदे और नुकसान हैं. वह फ़ॉर्मैट चुनें जो आपकी साइट और सेटअप के लिए सबसे सही है (फ़ॉर्मैट को लेकर Google की कोई प्राथमिकता नहीं है). यहां दी गई टेबल में, साइटमैप के अलग-अलग फ़ॉर्मैट की तुलना की गई है:

साइटमैप की तुलना
एक्सएमएल साइटमैप

एक्सएमएल साइटमैप, साइटमैप के सभी फ़ॉर्मैट में से सबसे ज़्यादा खूबियों वाला साइटमैप है. इसमें ज़्यादा जानकारी शामिल की जा सकती है. इस साइटमैप में, इमेज, वीडियो, और खबरों वाले कॉन्टेंट के लिए अलग से डेटा शामिल किया जा सकता है. साथ ही, इसमें स्थानीय जगह के मुताबिक बनाए गए पेज के वर्शन के लिए डेटा शामिल किया जा सकता है.

फ़ायदे:
  • ज़्यादा जानकारी शामिल की जा सकती है. साथ ही, बहुत सारी खूबियां हैं.
  • यह आपके यूआरएल के बारे में सबसे ज़्यादा जानकारी दे सकता है.
  • ज़्यादातर कॉन्टेंट मैनेजमेंट सिस्टम (सीएमएस), साइटमैप अपने-आप जनरेट करते हैं या सीएमएस का इस्तेमाल करने वाले को साइटमैप के कई प्लगिन मिल सकते हैं.
नुकसान:
  • इसका इस्तेमाल करना मुश्किल हो सकता है.
  • बड़ी साइटों पर या ऐसी साइटों पर मैप करना मुश्किल हो सकता है जहां यूआरएल अक्सर बदलते रहते हैं.
आरएसएस, एमआरएसएस, और ऐटम 1.0

आरएसएस, एमआरएसएस, और ऐटम 1.0 साइटमैप, एक्सएमएल साइटमैप की तरह ही होते हैं. हालांकि, इन्हें सबसे आसानी से उपलब्ध कराया जा सकता है, क्योंकि सीएमएस इन्हें अपने-आप बनाते हैं.

फ़ायदे:
  • ज़्यादातर सीएमएस, आरएसएस और ऐटम फ़ीड अपने-आप जनरेट करते हैं.
  • इसका इस्तेमाल, Google को आपके वीडियो के बारे में जानकारी देने के लिए किया जा सकता है.
नुकसान:
टेक्स्ट साइटमैप

यह साइटमैप का सबसे आसान फ़ॉर्मैट है. इसमें सिर्फ़ एचटीएमएल और इंडेक्स किए जा सकने वाले दूसरे पेजों के यूआरएल लिस्ट किए जा सकते हैं.

फ़ायदे:

  • खास तौर पर, बड़ी साइटों पर काम करना आसान होता है.

नुकसान:

  • इसका इस्तेमाल, सिर्फ़ एचटीएमएल और इंडेक्स किए जा सकने वाले दूसरे टेक्स्ट कॉन्टेंट के लिए ही किया जा सकता है.

साइटमैप इस्तेमाल करने के सबसे सही तरीके

साइटमैप तैयार करने के सबसे सही तरीके, साइटमैप प्रोटोकॉल से तय किए जाते हैं. सबसे ज़्यादा अनदेखा किए जाने वाले सबसे सही तरीके, साइज़ की सीमाओं, साइटमैप के मौजूद होने की जगह, और साइटमैप में शामिल यूआरएल से जुड़े हैं.

साइटमैप के साइज़ की सीमाएं: किसी भी फ़ॉर्मैट में साइटमैप का साइज़, 50 एमबी (बिना कंप्रेस किए) से ज़्यादा नहीं होना चाहिए या उसमें 50,000 से ज़्यादा यूआरएल मौजूद नहीं होने चाहिए. अगर आपकी साइट में 50,000 से ज़्यादा यूआरएल हैं या साइटमैप का साइज़ 50 एमबी से ज़्यादा है, तो आपको अपने साइटमैप को कई साइटमैप में बांटना होगा. आप चाहें, तो साइटमैप इंंडेक्स फ़ाइल बनाकर Google को सबमिट की जा सकती है. Google को एक से ज़्यादा साइटमैप और साइटमैप की इंडेक्स फ़ाइलें सबमिट की जा सकती हैं. अगर आपको Search Console में हर साइटमैप के लिए खोज की परफ़ॉर्मेंस ट्रैक करनी है, तो यह तरीका आपके लिए काम का हो सकता है.

साइटमैप फ़ाइल की एन्कोडिंग और जगह की जानकारी: साइटमैप फ़ाइल, UTF-8 एन्कोड में होनी चाहिए. साइटमैप को आपकी साइट पर कहीं भी होस्ट किया जा सकता है. हालांकि, Search Console का इस्तेमाल करके साइटमैप सबमिट न करने पर, साइटमैप सिर्फ़ पैरंट डायरेक्ट्री के डिसेंडेंट पर असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. हम साइट रूट पर ही साइटमैप पोस्ट करने का सुझाव देते हैं.

रेफ़र किए गए यूआरएल की प्रॉपर्टी: अपने साइटमैप में, पूरी तरह क्वालिफ़ाइड और पूरे यूआरएल का इस्तेमाल करें. Google, आपके यूआरएल को ठीक वैसे ही क्रॉल करने की कोशिश करेगा, जैसे उन्हें लिस्ट किया गया होगा. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो /mypage.html (कोई मिलता-जुलता यूआरएल) जैसे किसी यूआरएल को शामिल न करें. पूरे यूआरएल का ही इस्तेमाल करें: https://www.example.com/mypage.html.

अपने साइटमैप में उन यूआरएल को शामिल करें जिन्हें आपको Google के खोज के नतीजों में देखना है. आम तौर पर, Google अपने खोज के नतीजों में कैननिकल यूआरएल दिखाता है. साइटमैप का इस्तेमाल करके, यह चुना जा सकता है कि खोज के नतीजों में किन यूआरएल को दिखाना है. अगर आपके वेब पेज के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. हालांकि, अगर साइटमैप में दोनों यूआरएल के बारे में बताना हो, तो दोनों यूआरएल की जानकारी दें और बताएं कि कौनसा यूआरएल डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का.

सबसे सही तरीकों की पूरी सूची के लिए, साइटमैप प्रोटोकॉल देखें.

एक्सएमएल साइटमैप

एक्सएमएल साइटमैप, काम करने वाले साइटमैप के सभी फ़ॉर्मैट में से सबसे ज़्यादा खूबियों वाला साइटमैप है. Google के साथ काम करने वाले साइटमैप एक्सटेंशन का इस्तेमाल करके, इमेज, वीडियो, और खबरों वाले कॉन्टेंट के लिए अलग से जानकारी शामिल की जा सकती है. साथ ही, इसमें स्थानीय जगह के अनुसार बनाए गए पेज के वर्शन के लिए जानकारी शामिल की जा सकती है.

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है. इसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://www.example.com/foo.html</loc>
    <lastmod>2022-06-04</lastmod>
  </url>
</urlset>

sitemaps.org पर, ज़्यादा कॉम्प्लेक्स साइटमैप के उदाहरण देखे जा सकते हैं. साथ ही, यहां आपको दस्तावेज़ में दी गई पूरी जानकारी भी मिलेगी.

एक्सएमएल साइटमैप के बारे में ज़्यादा जानकारी

  • सभी एक्सएमएल फ़ाइलों की तरह, एक्सएमएल साइटमैप में सभी टैग वैल्यू के लिए एंटिटी एस्केप की जानी चाहिए.
  • Google, <priority> और <changefreq> वैल्यू को नज़रअंदाज़ कर देता है.
  • Google, <lastmod> वैल्यू का इस्तेमाल तब ही करता है, जब वैल्यू लगातार एक जैसी और पुष्टि करने पर (उदाहरण के लिए, पेज में पिछली बार किए गए बदलाव की तुलना करके) सटीक पाई जाती है.

आरएसएस, एमआरएसएस, और ऐटम 1.0

अगर आपका कॉन्टेंट मैनेजमेंट सिस्टम, आरएसएस या ऐटम फ़ीड शामिल है, तो फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट किया जा सकता है. ज़्यादातर सीएमएस आपके लिए एक फ़ीड बनाते हैं. हालांकि, ध्यान रखें कि यह फ़ीड सिर्फ़ हाल ही के यूआरएल की जानकारी देता है.

आरएसएस, एमआरएसएस, और ऐटम 1.0 के बारे में ज़्यादा जानकारी

  • Google पर आरएसएस 2.0 और ऐटम 1.0 के फ़ीड इस्तेमाल किए जा सकते हैं.
  • Google को अपनी साइट पर मौजूद वीडियो की जानकारी देने के लिए, एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल किया जा सकता है.
  • सभी एक्सएमएल फ़ाइलों की तरह, एक्सएमएल साइटमैप में सभी टैग वैल्यू के लिए एंटिटी एस्केप की जानी चाहिए.

टेक्स्ट साइटमैप

अगर आपको सिर्फ़ वेब पेज के यूआरएल देने हैं, तो एक सामान्य टेक्स्ट फ़ाइल बनाई जा सकती है, जिसमें हर लाइन में एक यूआरएल शामिल हो. इसके बाद, उसे Google को सबमिट किया जा सकता है. उदाहरण के लिए, अगर आपकी साइट पर दो पेज हैं, तो उन्हें इस तरह से साइटमैप में जोड़ा जा सकता है:

https://www.example.com/file1.html
https://www.example.com/file2.html

टेक्स्ट फ़ाइल वाले साइटमैप के बारे में ज़्यादा जानकारी

  • साइटमैप फ़ाइल में यूआरएल के अलावा कुछ और न डालें.
  • टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दिया जा सकता है, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे, sitemap.txt).

साइटमैप बनाने का तरीका

साइटमैप बनाकर सर्च इंजन को यह बताया जाता है कि खोज के नतीजों में कौनसे यूआरएल को ज़्यादा दिखाया जाना है. ये कैननिकल यूआरएल होते हैं. अगर आपके पास एक ही कॉन्टेंट दिखाने वाले कई यूआरएल हैं, तो उनमें से अपनी पसंद का यूआरएल चुनें और उसे साइटमैप में शामिल करें. एक ही कॉन्टेंट पर ले जाने वाले सभी यूआरएल को साइटमैप में शामिल न करें.

यह तय कर लेने के बाद कि साइटमैप में कौनसे यूआरएल को शामिल करने हैं, अपनी साइट के लिए साइटमैप बनाएं. इसके लिए, अपनी साइट की बनावट और साइज़ के आधार पर, यहां बताए गए तरीकों में से किसी एक को चुनें:

कॉन्टेंट मैनेजमेंट सिस्टम को साइटमैप जनरेट करने देना

अगर WordPress, Wix या Blogger जैसे किसी कॉन्टेंट मैनेजमेंट सिस्टम का इस्तेमाल किया जा रहा है, तो हो सकता है कि आपके कॉन्टेंट मैनेजमेंट सिस्टम ने पहले से ही, सर्च इंजन को साइटमैप उपलब्ध करा दिया हो. इस बारे में जानकारी खोजें कि कॉन्टेंट मैनेजमेंट सिस्टम, साइटमैप कैसे जनरेट करता है. इसके अलावा, यह जानकारी भी देखें कि अगर आपका कॉन्टेंट मैनेजमेंट सिस्टम अपने-आप साइटमैप जनरेट नहीं करता है, तो साइटमैप बनाने का तरीका क्या है. उदाहरण के लिए, Wix के मामले में, "Wix साइटमैप" खोजें या Blogger के मामले में, "Blogger आरएसएस" खोजें.

मैन्युअल तरीके से साइटमैप बनाना

जिन साइटमैप में कुछ दर्ज़न से भी कम यूआरएल हैं उनके लिए, मैन्युअल तरीके से साइटमैप बनाया जा सकता है. मैन्युअल तरीके से साइटमैप बनाने के लिए, Windows Notepad या Nano (Linux, MacOS), जैसा कोई टेक्स्ट एडिटर खोलें. साथ ही, साइटमैप फ़ॉर्मैट सेक्शन में बताए गए सिंटैक्स के दिशा-निर्देशों का पालन करें. टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दिया जा सकता है, लेकिन देख लें कि यूआरएल में उन वर्णों का इस्तेमाल किया जा सकता हो जिनकी अनुमति हो.

बड़े साइटमैप भी मैन्युअल तरीके से बनाए जा सकते हैं. हालांकि, इस प्रोसेस में बहुत मेहनत लगती है और इसे लंबे समय तक बनाए रखना मुश्किल है.

टूल की मदद से ऑटोमैटिक तरीके से साइटमैप जनरेट करना

जिन साइटमैप में कुछ दर्ज़न से ज़्यादा यूआरएल हैं उनके लिए, आपको ऑटोमैटिक तरीके से साइटमैप जनरेट करना होगा. ऐसे कई टूल हैं जिनका इस्तेमाल करके, साइटमैप जनरेट किया जा सकता है. हालांकि, साइटमैप बनाने का सबसे अच्छा तरीका यह है कि आपकी वेबसाइट का सॉफ़्टवेयर इसे जनरेट करे. उदाहरण के लिए, वेबसाइट के डेटाबेस से अपनी साइट के यूआरएल निकालकर, इन्हें वेब सर्वर पर, अपनी स्क्रीन या ओरिजनल फ़ाइल में एक्सपोर्ट किया जा सकता है. इस तरीके से साइटमैप बनाने के बारे में अपने डेवलपर या सर्वर मैनेजर से बात करें. अगर आपको कोड को लेकर मदद चाहिए, तो तीसरे पक्ष के साइटमैप जनरेटर के हमारे पुराने और बिना रखरखाव वाले कलेक्शन को देखें.

आपको साइटमैप में यूआरएल के क्रम को लेकर चिंता करने की ज़रूरत नहीं है. Google को इससे कोई फ़र्क़ नहीं पड़ता. साइटमैप के लिए साइज़ से जुड़ी ज़रूरी शर्तों पर ध्यान दें. अगर साइटमैप का साइज़ बहुत बड़ा हो जाता है, तो आपको उसे छोटे-छोटे साइटमैप में बांटना होगा. बड़े साइटमैप मैनेज करने के बारे में ज़्यादा जानें.

Google को अपना साइटमैप सबमिट करना

ध्यान रखें कि साइटमैप को सबमिट करना सिर्फ़ एक संकेत है. इससे, यह पक्का नहीं होता कि Google साइटमैप को डाउनलोड करेगा या साइट पर यूआरएल को क्रॉल करने के लिए साइटमैप का इस्तेमाल करेगा. आप Google को अपना साइटमैप उपलब्ध करा सकें, इसके लिए कुछ तरीके यहां दिए गए हैं:

  • साइटमैप की रिपोर्ट का इस्तेमाल करके, Search Console में साइटमैप सबमिट करें. इससे आपको यह देखने में मदद मिलेगी कि Googlebot ने साइटमैप को कब ऐक्सेस किया. साथ ही, आपको प्रोसेस को लेकर संभावित गड़बड़ियों की जानकारी भी मिलेगी.
  • प्रोग्राम के हिसाब से, अपने-आप होने वाली प्रोसेस के ज़रिए साइटमैप सबमिट करने के लिए, Search Console API का इस्तेमाल करें.
  • यह जानकारी देने के लिए कि आपके साइटमैप पर कैसे पहुंचा जा सकता है, नीचे दी गई लाइन को अपनी robots.txt फ़ाइल में कहीं भी डाल दें. अगली बार आपकी robots.txt फ़ाइल को क्रॉल करते समय हम इसका इस्तेमाल करेंगे:
    Sitemap: https://example.com/my_sitemap.xml
  • ऐटम या आरएसएस का इस्तेमाल करने पर, WebSub का इस्तेमाल करके, अपने बदलावों को Google जैसे सर्च इंजन पर ब्रॉडकास्ट किया जा सकता है.

एक से ज़्यादा साइटों के लिए साइटमैप सबमिट करने का तरीका

अगर आपकी एक से ज़्यादा वेबसाइटें हैं, तो सबमिट करने की प्रोसेस को आसान बनाया जा सकता है. इसके लिए, आपको एक या एक से ज़्यादा ऐसे साइटमैप बनाने होंगे जिनमें आपकी उन सभी साइटों के यूआरएल हों जिनकी पुष्टि हो चुकी है. साथ ही, साइटमैप को एक ही जगह पर सेव करना होगा. इनका इस्तेमाल किया जा सकता है:

  • कोई ऐसा साइटमैप जिसमें कई वेबसाइटों के यूआरएल शामिल हों. ये यूआरएल अलग-अलग डोमेन की वेबसाइटों के भी हो सकते हैं. उदाहरण के लिए, https://host1.example.com/sitemap.xml पर मौजूद साइटमैप में ये यूआरएल शामिल हो सकते हैं.
    • https://host1.example.com
    • https://host2.example.com
    • https://host3.example.com
    • https://host1.example1.com
    • https://host1.example.ch
  • ऐसे अलग-अलग साइटमैप (हर साइट के लिए एक) जो एक ही जगह पर मौजूद हों.
    • https://host1.example.com/host1-example-sitemap.xml
    • https://host1.example.com/host2-example-sitemap.xml
    • https://host1.example.com/host3-example-sitemap.xml
    • https://host1.example.com/host1-example1-sitemap.xml
    • https://host1.example.com/host1-example-ch-sitemap.xml

एक ही जगह पर होस्ट होने वाले क्रॉस-साइट साइटमैप सबमिट करने के लिए, Search Console या robots.txt का इस्तेमाल करें.

Search Console के साथ साइटमैप का क्रॉस-सबमिशन

  1. देखें कि आपने उन सभी साइटों के मालिकाना हक की पुष्टि कर ली है जिन्हें आपको साइटमैप में जोड़ना है.
  2. ऐसा साइटमैप बनाएं जिसमें उन सभी साइटों के यूआरएल शामिल हों जिन्हें आपको शामिल करना है. इसके अलावा, एक से ज़्यादा साइटमैप भी बनाए जा सकते हैं. आपके पास साइटमैप इंडेक्स फ़ाइल में साइटमैप जोड़ने का विकल्प होता है. ऐसा तब करें, जब आपको उस साइटमैप इंडेक्स का इस्तेमाल करना है.
  3. Google Search Console का इस्तेमाल करके, अपने साइटमैप या साइटमैप की इंडेक्स फ़ाइल सबमिट करें.

robots.txt की मदद से साइटमैप सबमिट करना

  1. हर साइट के लिए एक या इससे ज़्यादा साइटमैप बनाएं. हर साइटमैप फ़ाइल के लिए, देखें कि एक ही साइट के यूआरएल शामिल किए गए हों.
  2. सभी साइटमैप को उस साइट पर अपलोड करें जिस पर आपका कंट्रोल है. उदाहरण के लिए, https://sitemaps.example.com.
  3. हर साइट के लिए, देखें कि robots.txt फ़ाइल उस साइट के साइटमैप की जानकारी देती हो. उदाहरण के लिए, अगर आपने https://example.com/ के लिए साइटमैप बनाया है और आपको उसे https://sitemaps.example.com/sitemap-example-com.xml पर होस्ट करना है, तो robots.txt फ़ाइल में https://example.com/robots.txt के साथ उस साइटमैप की जानकारी दें.
    # robots.txt file of https://example.com/
    sitemap: https://sitemaps.example.com/sitemap-example-com.xml

साइटमैप से जुड़ी समस्या हल करना

Google Search Console की मदद से साइटमैप से जुड़ी समस्या हल की जा सकती है. सहायता पाने के लिए, साइटमैप से जुड़ी समस्या हल करने की गाइड देखें.