साइटमैप बनाना और उसे सबमिट करना

इस पेज पर साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. साइटमैप के बारे में यहां ज़्यादा जानें.

  1. तय करें कि आप किस साइटमैप फ़ॉर्मैट का इस्तेमाल करना चाहते हैं.
  2. ऑटोमैटिक या मैन्युअल तरीके से साइटमैप बनाएं.
  3. अपना साइटमैप, Google को उपलब्ध कराने के लिए, उसे अपनी robots.txt फ़ाइल में जोड़ें या सीधे Search Console में सबमिट करें.

साइटमैप के फ़ॉर्मैट

Google पर साइटमैप के कई तरह के फ़ॉर्मैट काम करते हैं:

Google पर, सभी फ़ॉर्मैट के लिए स्टैंडर्ड साइटमैप प्रोटोकॉल का इस्तेमाल किया जाना चाहिए. Google, फ़िलहाल साइटमैप में <priority> एट्रिब्यूट का इस्तेमाल नहीं करता है.

सभी फ़ॉर्मैट में, किसी भी साइटमैप का साइज़ 50 एमबी (बिना कंप्रेस किए) या उससे कम होना चाहिए. साथ ही, उसमें 50,000 से ज़्यादा यूआरएल नहीं होने चाहिए. अगर आपकी फ़ाइल का साइज़ इससे बड़ा है या यूआरएल की संख्या ज़्यादा है, तो आपको अपनी सूची को कई साइटमैप में बांटना होगा. इसके बजाय, आप साइटमैप इंंडेक्स फ़ाइल (एक ऐसी फ़ाइल जिसमें साइटमैप की सूची शामिल होती है) बनाकर Google को सबमिट कर सकते हैं. आप Google को एक से ज़्यादा साइटमैप और/या साइटमैप इंडेक्स फ़ाइलें सबमिट कर सकते हैं.

एक्सएमएल

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है. इसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

आप sitemaps.org पर, ज़्यादा जटिल साइटमैप के उदाहरण और पूरे दस्तावेज़ देख सकते हैं.

आप किसी दूसरी भाषा के पेजों के बारे में बताने वाले साइटमैप के उदाहरण देख सकते हैं. इसके अलावा, समाचार, इमेज या वीडियो फ़ाइल के लिए भी साइटमैप के उदाहरण देख सकते हैं.

आरएसएस, एमआरएसएस, और ऐटम 1.0

अगर आपके ब्लॉग में आरएसएस या ऐटम फ़ीड शामिल है, तो आप फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट कर सकते हैं. ज़्यादातर ब्लॉग सॉफ़्टवेयर आपके लिए फ़ीड बना सकते हैं. हालांकि, इस बात का ध्यान रखें कि यह फ़ीड सिर्फ़ हाल के यूआरएल की जानकारी देता है.

  • Google पर आरएसएस 2.0 और ऐटम 1.0 फ़ीड का इस्तेमाल किया जा सकता है.
  • आप Google को अपनी साइट पर मौजूद वीडियो की जानकारी देने के लिए, एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल कर सकते हैं.

टेक्स्ट

अगर आपके साइटमैप में सिर्फ़ वेब पेज से जुड़े यूआरएल शामिल हैं, तो आप Google को एक ऐसी सामान्य टेक्स्ट फ़ाइल भेज सकते हैं जिसमें हर एक लाइन में सिर्फ़ एक यूआरएल हो. जैसे:

http://www.example.com/file1.html
http://www.example.com/file2.html

टेक्स्ट फ़ाइल वाले साइटमैप के लिए दिशा-निर्देश

  • UTF-8 एन्कोडिंग का इस्तेमाल करके, अपनी फ़ाइल को कोड में बदलें.
  • साइटमैप फ़ाइल में यूआरएल के अलावा कुछ और न डालें.
  • आप टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दे सकते हैं, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे, sitemap.txt).

अन्य तरह के मीडिया के लिए, साइटमैप के एक्सटेंशन

यहां दिए गए अलग-अलग तरह के मीडिया के लिए, Google पर एक्सटेंशन से जुड़े साइटमैप सिंटैक्स का इस्तेमाल किया जा सकता है. अपनी साइट पर मौजूद वीडियो फ़ाइलों और इमेज के साथ-साथ ऐसे कॉन्टेंट के बारे में बताने के लिए इन एक्सटेंशन का इस्तेमाल करें जिसे पार्स करना मुश्किल हो. इससे, इन रिसॉर्स को बेहतर तरीके से इंडेक्स किया जा सकेगा.

साइटमैप से जुड़े सामान्य दिशा-निर्देश

  • ऐसे यूआरएल इस्तेमाल करें जो साइट के नाम जैसे ही हों और सभी शर्तें पूरी करते हों. Google आपके यूआरएल को ठीक वैसे ही क्रॉल करेगा जैसे उन्हें लिस्ट किया गया होगा. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो यूआरएल को https://example.com/ (www मौजूद नहीं है) या ./mypage.html (एक मिलता-जुलता यूआरएल) के तौर पर न दिखाएं.
  • साइटमैप को आपकी साइट पर कहीं भी पोस्ट किया जा सकता है, लेकिन साइटमैप सिर्फ़ पैरंट डायरेक्ट्री के डिसेंडेंट (नीचे के लेवल की डायरेक्ट्री) पर असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. हम साइट रूट पर ही साइटमैप पोस्ट करने का सुझाव देते हैं.
  • अपने साइटमैप में, यूआरएल के सेशन आईडी शामिल न करें. इससे, उन यूआरएल की डुप्लीकेट क्रॉलिंग कम हो जाती है.
  • hreflang एनोटेशन की मदद से, Google को किसी यूआरएल के दूसरी भाषाओं वाले वर्शन के बारे में बताएं.
  • यह ज़रूरी है कि साइटमैप फ़ाइलों को UTF-8 कोड में बदला गया हो. साथ ही, उन्हें सही तरीके से यूआरएल एस्केप किया गया हो.
  • बड़े साइटमैप को छोटे-छोटे साइटमैप में बांटें: एक साइटमैप में ज़्यादा से ज़्यादा 50,000 यूआरएल हो सकते हैं. साथ ही, यह भी ज़रूरी है कि बिना कंप्रेस किए गए साइटमैप का साइज़ 50 एमबी से ज़्यादा न हो. अलग-अलग साइटमैप सबमिट करने के बजाय, साइटमैप इंंडेक्स फ़ाइल का इस्तेमाल करके, सभी साइटमैप की सूची बनाएं. इसके बाद, सूची वाली इस फ़ाइल को Google पर सबमिट करें.
  • अपने साइटमैप में सिर्फ़ कैननिकल यूआरएल की जानकारी दें. अगर आपके पास किसी पेज के दो वर्शन हैं, तो साइटमैप में सिर्फ़ उस वर्शन की जानकारी दें जिसे आप खोज के नतीजों में दिखाना चाहते हैं. अगर आपकी साइट के दो वर्शन हैं (उदाहरण के लिए, www और www के अलावा कोई और वर्शन), तो यह तय करें कि आपको कौनसी साइट ज़्यादा पसंद है. इसके बाद, साइटमैप को अपने पसंदीदा वर्शन में शामिल करें और rel=canonical या रीडायरेक्ट को दूसरी साइट में जोड़ें.
  • अगर आपके वेब पेज के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. हालांकि, अगर आप साइटमैप में दोनों यूआरएल के बारे में बताना चाहते हैं, तो दोनों यूआरएल के एनोटेशन दें और बताएं कि कौनसा यूआरएल, डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का.
  • वीडियो, इमेज, और समाचार जैसे किसी अन्य तरह के मीडिया के बारे में बताने के लिए, साइटमैप एक्सटेंशन का इस्तेमाल करें.
  • अगर अलग-अलग भाषाओं या इलाकों के लिए आपकी साइट के अलग-अलग पेज हैं, तो साइटमैप या एचटीएमएल टैग में hreflang का इस्तेमाल करके, आप इन अलग-अलग पेजों के यूआरएल के बारे में जानकारी दे सकते हैं.
  • ऐसे वर्ण जो अक्षर या अंक नहीं हैं और लैटिन भाषा के भी नहीं हैं. आपकी साइटमैप फ़ाइल UTF-8 कोड में बदली हुई होनी चाहिए (आप फ़ाइल सेव करते समय ऐसा कर सकते हैं). सभी एक्सएमएल फ़ाइलों की तरह, डेटा से जुड़ी किसी भी वैल्यू (इसमें यूआरएल भी शामिल हैं) के लिए यह ज़रूरी है कि वह इस टेबल में मौजूद वर्णों के लिए, एंटिटी एस्केप कोड का इस्तेमाल करे. साइटमैप में सिर्फ़ ASCII वर्ण शामिल किए जा सकते हैं; इसमें अंग्रेज़ी के बड़े अक्षरों वाले ASCII वर्ण, कुछ चुनिंदा कंट्रोल कोड या * और {} जैसे विशेष वर्ण शामिल नहीं किए जा सकते. अगर आपके साइटमैप के यूआरएल में ये वर्ण हैं, तो साइटमैप को जोड़ते समय आपको गड़बड़ी की सूचना मिलेगी.
    वर्ण चिह्न एस्केप कोड
    एंपरसैंड & &amp;
    सिंगल कोट ' &apos;
    डबल कोट " &quot;
    इससे ज़्यादा > &gt;
    इससे कम < &lt;

    इसके अलावा, सभी यूआरएल (इनमें आपके साइटमैप का यूआरएल भी शामिल है) को उस सर्वर के हिसाब से कोड में बदला जाना चाहिए जिस पर वे मौजूद हैं. साथ ही, उन्हें यूआरएल एस्केप भी किया जाना चाहिए. अगर आप यूआरएल बनाने के लिए किसी तरह की स्क्रिप्ट, टूल या लॉग फ़ाइल (हाथ से टाइप करने के बजाय किसी और तरीके से) का इस्तेमाल कर रहे हैं, तो आम तौर पर यह काम आपके लिए पहले ही किया जा चुका होता है. साइटमैप सबमिट करते समय, अगर आपको इस गड़बड़ी की सूचना मिलती है कि Google को आपके कुछ यूआरएल नहीं मिल रहे हैं, तो इस बात की अच्छी तरह से जांच कर लें कि आपके यूआरएल, यूआरआई के RFC-3986 स्टैंडर्ड, आईआरआई के RFC-3987 स्टैंडर्ड, और एक्सएमएल स्टैंडर्ड का पालन करते हैं या नहीं.

    यहां एक ऐसे यूआरएल का उदाहरण दिया गया है जो किसी ऐसे वर्ण का इस्तेमाल करता है जो ASCII कोड में शामिल नहीं है (जैसे, ü). साथ ही, यह ऐसे किसी वर्ण (जैसे, &) का भी इस्तेमाल करता है जिसके लिए एंटिटी एस्केप करना ज़रूरी है:

    http://www.example.com/ümlat.html&q=name

    यहां वही यूआरएल, ISO-8859-1 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कि वही एन्कोडिंग इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:

    http://www.example.com/%FCmlat.html&q=name

    यहां वही यूआरएल, UTF-8 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कि वही एन्कोडिंग इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:

    http://www.example.com/%C3%BCmlat.html&q=name

    यहां वही यूआरएल, एंटिटी एस्केप करने के बाद दिया गया है:

    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • याद रखें कि साइटमैप, Google को दिए गए सुझाव होते हैं, जिनसे यह पता चलता है कि कौनसे पेज आपके लिए ज़्यादा ज़रूरी हैं; Google किसी साइटमैप में मौजूद हर यूआरएल को क्रॉल करने का वादा नहीं करता है.
  • Google, <priority> और <changefreq> वैल्यू को अनदेखा कर देता है.
  • Google, <lastmod> वैल्यू का इस्तेमाल तब ही करता है, जब वैल्यू लगातार एक जैसी और पुष्टि करने पर (उदाहरण के लिए, पेज में पिछली बार किए गए बदलाव की तुलना करके) सटीक पाई जाती है.
  • साइटमैप में यूआरएल की पोज़िशन मायने नहीं रखती; Google, यूआरएल को उस क्रम में क्रॉल नहीं करता जिसमें वे आपके साइटमैप में दिखते हैं.

साइटमैप बनाने का तरीका

साइटमैप बनाने का यह मतलब है कि आप सर्च इंजन को बता रहे हैं कि आप खोज के नतीजों में कौनसे यूआरएल दिखाना पसंद करेंगे. ये कैननिकल यूआरएल होते हैं. अगर आपके पास एक ही कॉन्टेंट दिखाने वाले कई यूआरएल हैं, तो उनमें से अपनी पसंद का यूआरएल चुनें और उसे साइटमैप में शामिल करें. एक ही कॉन्टेंट पर ले जाने वाले सभी यूआरएल साइटमैप में शामिल न करें.

यह तय कर लेने के बाद कि साइटमैप में किन यूआरएल को शामिल करना है, अपनी साइट के लिए साइटमैप बनाएं. इसके लिए, अपनी साइट की बनावट और साइज़ के आधार पर, यहां बताए गए तरीकों में से कोई एक तरीका चुनें:

कॉन्टेंट मैनेजमेंट सिस्टम को साइटमैप जनरेट करने देना

अगर आप WordPress, Wix या Blogger जैसे किसी कॉन्टेंट मैनेजमेंट सिस्टम का इस्तेमाल कर रहे हैं, तो हो सकता है कि आपके कॉन्टेंट मैनेजमेंट सिस्टम ने पहले से ही, सर्च इंजन को साइटमैप उपलब्ध करा दिया हो. इस बारे में जानकारी खोजें कि कॉन्टेंट मैनेजमेंट सिस्टम, साइटमैप कैसे जनरेट करता है. इसके अलावा, यह जानकारी भी देखें कि अगर आपका कॉन्टेंट मैनेजमेंट सिस्टम अपने-आप साइटमैप जनरेट नहीं करता है, तो साइटमैप बनाने का तरीका क्या है. जैसे, Wix के बारे में जानने के लिए, "wix साइटमैप" खोजें.

अन्य सभी साइटों के सेट अप के लिए, आपको साइटमैप खुद ही जनरेट करना होगा.

मैन्युअल तरीके से साइटमैप बनाना

जिन साइटमैप में कुछ दर्जन से भी कम यूआरएल हैं उनके लिए, आप मैन्युअल तरीके से साइटमैप बना सकते हैं. मैन्युअल तरीके से साइटमैप बनाने के लिए, Windows Notepad या Nano (Linux, MacOS) जैसा कोई टेक्स्ट एडिटर खोलें. साथ ही, साइटमैप फ़ॉर्मैट सेक्शन में बताए गए सिंटैक्स के मुताबिक काम करें.

आप बड़े साइटमैप भी मैन्युअल तरीके से बना सकते हैं, लेकिन इस प्रक्रिया में बहुत मेहनत लगती है.

ऑटोमैटिक तरीके से साइटमैप जनरेट करना

जिन साइटमैप में कुछ दर्ज़न से ज़्यादा यूआरएल हैं उनके लिए, आपको ऑटोमैटिक तरीके से साइटमैप जनरेट करना होगा. ऐसे कई टूल हैं जिनका इस्तेमाल करके, साइटमैप जनरेट किया जा सकता है. हालांकि, साइटमैप बनाने का सबसे अच्छा तरीका यह है कि आपकी वेबसाइट का सॉफ़्टवेयर इसे जनरेट करे. उदाहरण के लिए, आप वेबसाइट के डेटाबेस से अपनी साइट के यूआरएल निकालकर, इन्हें वेब सर्वर पर, अपनी स्क्रीन या मूल फ़ाइल में एक्सपोर्ट कर सकते हैं. इस तरीके से साइटमैप बनाने के बारे में अपने डेवलपर या सर्वर मैनेजर से बात करें. अगर आपको कोड से जुड़ी मदद चाहिए, तो तीसरे पक्ष के साइटमैप जनरेटर से जुड़े हमारे पुराने संग्रह को देखें.

ध्यान रखें कि साइटमैप का साइज़ 50 एमबी से ज़्यादा नहीं हो सकता. बड़े साइटमैप मैनेज करने के बारे में ज़्यादा जानें.

Google को अपना साइटमैप सबमिट करना

Google हर बार साइट क्रॉल करने पर साइटमैप की जांच नहीं करता. साइटमैप को सिर्फ़ पहली बार देखे जाने पर उसकी जांच की जाती है. इसके बाद, सिर्फ़ तब उसकी जांच होती है, जब आप हमें यह बताते हैं कि उसमें बदलाव हुआ है. आपको Google को साइटमैप के बारे में सिर्फ़ तब सूचना देनी चाहिए, जब वह नया हो या अपडेट किया गया हो. ऐसे साइटमैप बार-बार सबमिट या पिंग न करें जिनमें कोई भी बदलाव नहीं हुआ.

अगर आपने साइटमैप में पेजों को अपडेट किया है, तो उन पर <lastmod> फ़ील्ड का निशान लगाएं. दूसरी एक्सएमएल फ़ाइलों में भी ऐसा फ़ील्ड होता है, जैसे कि ऐटम एक्सएमएल के लिए <updated>. आप इस तारीख का पता लगाने का तरीका भी जान सकते हैं.

Google को अपना साइटमैप उपलब्ध करवाने के कुछ तरीके यहां दिए गए हैं:

  • साइटमैप की रिपोर्ट का इस्तेमाल करके, साइटमैप सबमिट करें.
  • पिंग करने वाले टूल का इस्तेमाल करें. अपने ब्राउज़र या कमांड लाइन में इस पते पर जीईटी अनुरोध भेजें. इस अनुरोध में साइटमैप का पूरा यूआरएल शामिल करें. यह पक्का कर लें कि साइटमैप फ़ाइल को ऐक्सेस किया जा सकता हो:
    https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP

    उदाहरण के लिए:

    https://www.google.com/ping?sitemap=https://example.com/sitemap.xml
  • अपने साइटमैप के पाथ की जानकारी देने के लिए, नीचे दी गई लाइन को अपनी robots.txt फ़ाइल में कहीं भी शामिल करें. अगली बार आपकी robots.txt फ़ाइल को क्रॉल करते समय हम इसका इस्तेमाल करेंगे:
    Sitemap: https://example.com/my_sitemap.xml
  • अगर आप अपने साइटमैप के लिए ऐटम या आरएसएस का इस्तेमाल करते हैं और Google के साथ-साथ दूसरे सर्च इंजन में हुए बदलावों को लागू करना चाहते हैं, तो WebSub का इस्तेमाल करें.

साइटमैप से जुड़ी समस्या हल करना

साइटमैप से जुड़ी समस्या हल करने वाली गाइड देखें.