साइटमैप बनाना और उसे सबमिट करना

इस पेज पर साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. साइटमैप के बारे में यहां ज़्यादा जानें.

  1. यह तय करें कि Google को आपकी साइट के किन पेजों को क्रॉल करना चाहिए. साथ ही, हर पेज का कैननिकल वर्शन भी तय करें.
  2. तय करें कि आप किस साइटमैप फ़ॉर्मैट का इस्तेमाल करना चाहते हैं. आप अपना साइटमैप मैन्युअल तरीके से बना सकते हैं. इसके अलावा, आप इसे बनाने के लिए, दिए गए तीसरे पक्ष के टूल में से किसी टूल का इस्तेमाल भी कर सकते हैं.
  3. अपना साइटमैप, Google को उपलब्ध कराने के लिए, उसे अपनी robots.txt फ़ाइल में जोड़ें या सीधे Search Console में सबमिट करें.

साइटमैप के फ़ॉर्मैट

Google पर साइटमैप के कई फ़ॉर्मैट इस्तेमाल किए जा सकते हैं. इन फ़ॉर्मैट के बारे में यहां बताया गया है. Google पर, सभी फ़ॉर्मैट के लिए स्टैंडर्ड साइटमैप प्रोटोकॉल का इस्तेमाल किया जाना चाहिए. Google, फ़िलहाल साइटमैप में <priority> एट्रिब्यूट का इस्तेमाल नहीं करता है.

सभी फ़ॉर्मैट में, एक साइटमैप का साइज़ 50 एमबी (बिना कंप्रेस किए) या उससे कम होना चाहिए. साथ ही, उसमें यूआरएल की कुल संख्या 50,000 से ज़्यादा नहीं होनी चाहिए. अगर आपकी फ़ाइल का साइज़ इससे बड़ा है या आपके पास इससे ज़्यादा यूआरएल हैं, तो आपको अपनी सूची को कई साइटमैप में बांटना होगा. इसके अलावा, आप एक साइटमैप इंंडेक्स फ़ाइल (एक ऐसी फ़ाइल जिसमें साइटमैप की सूची शामिल होती है) बना सकते हैं और उसे Google को सबमिट कर सकते हैं. आप Google को एक से ज़्यादा साइटमैप और/या साइटमैप इंडेक्स फ़ाइलें सबमिट कर सकते हैं.

एक्सएमएल

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है. इसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/foo.html</loc>
<lastmod>2018-06-04</lastmod>
</url>
</urlset>

आप sitemaps.org पर, ज़्यादा जटिल साइटमैप के उदाहरण और पूरे दस्तावेज़ देख सकते हैं.

आप किसी दूसरी भाषा के पेजों के बारे में बताने वाले साइटमैप के उदाहरण देख सकते हैं. इसके अलावा, समाचार, इमेज या वीडियो फ़ाइल के लिए साइटमैप के उदाहरण भी देख सकते हैं.

आरएसएस, एमआरएसएस, और ऐटम 1.0

अगर आपके ब्लॉग में आरएसएस या ऐटम फ़ीड शामिल है, तो आप फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट कर सकते हैं. ज़्यादातर ब्लॉग सॉफ़्टवेयर आपके लिए फ़ीड बना सकते हैं. हालांकि, इस बात का ध्यान रखें कि यह फ़ीड सिर्फ़ हाल के यूआरएल की जानकारी देता है.

  • Google पर आरएसएस 2.0 और ऐटम 1.0 फ़ीड का इस्तेमाल किया जा सकता है.
  • आप Google को अपनी साइट पर मौजूद वीडियो की जानकारी देने के लिए, एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल कर सकते हैं.

टेक्स्ट

अगर आपके साइटमैप में सिर्फ़ वेब पेज से जुड़े यूआरएल शामिल हैं, तो आप Google को एक ऐसी सामान्य टेक्स्ट फ़ाइल भेज सकते हैं जिसमें हर एक लाइन में सिर्फ़ एक यूआरएल हो. उदाहरण के लिए:

http://www.example.com/file1.html
http://www.example.com/file2.html
        

टेक्स्ट फ़ाइल वाले साइटमैप के लिए दिशा-निर्देश:

  • UTF-8 एन्कोडिंग का इस्तेमाल करके, अपनी फ़ाइल को कोड में बदलें.
  • साइटमैप फ़ाइल में, यूआरएल के अलावा कुछ और न डालें.
  • आप टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दे सकते हैं, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे कि sitemap.txt).

अन्य तरह के मीडिया के लिए, साइटमैप के एक्सटेंशन

यहां दिए गए अलग-अलग तरह के मीडिया के लिए, Google पर एक्सटेंशन से जुड़े साइटमैप सिंटैक्स का इस्तेमाल किया जा सकता है. अपनी साइट पर मौजूद वीडियो फ़ाइलों और इमेज के साथ-साथ ऐसे कॉन्टेंट के बारे में बताने के लिए इन एक्सटेंशन का इस्तेमाल करें जिसे पार्स करना मुश्किल हो. इससे, इन रिसॉर्स को बेहतर तरीके से इंडेक्स किया जा सकेगा.

साइटमैप से जुड़े सामान्य दिशा-निर्देश

  • ऐसे यूआरएल इस्तेमाल करें जो साइट के नाम जैसे ही हों और सभी शर्तें पूरी करते हों. Google आपके यूआरएल को ठीक वैसे ही क्रॉल करेगा जैसे उन्हें लिस्ट किया गया होगा. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो यूआरएल को https://example.com/ (www मौजूद नहीं है) या ./mypage.html (एक मिलता-जुलता यूआरएल) के तौर पर न दिखाएं.
  • साइटमैप को आपकी साइट पर कहीं भी पोस्ट किया जा सकता है, लेकिन साइटमैप सिर्फ़ पैरंट डायरेक्ट्री के नीचे के लेवल पर असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. हम साइट रूट पर ही साइटमैप पोस्ट करने का सुझाव देते हैं.
  • अपने साइटमैप में, यूआरएल के सेशन आईडी शामिल न करें. इससे, उन यूआरएल की डुप्लीकेट क्रॉलिंग कम हो जाती है.
  • hreflang एनोटेशन की मदद से, Google को किसी यूआरएल के दूसरी भाषाओं वाले वर्शन के बारे में बताएं.
  • यह ज़रूरी है कि साइटमैप फ़ाइलों को UTF-8 कोड में बदला गया हो. साथ ही, सही तरीके से यूआरएल एस्केप किए गए हों.
  • बड़े साइटमैप को छोटे-छोटे साइटमैप में बांटें: एक साइटमैप में ज़्यादा से ज़्यादा 50,000 यूआरएल हो सकते हैं. साथ ही, यह भी ज़रूरी है कि बिना कंप्रेस किए गए साइटमैप का साइज़ 50 एमबी से ज़्यादा न हो. अलग-अलग साइटमैप सबमिट करने के बजाय, साइटमैप इंंडेक्स फ़ाइल का इस्तेमाल करके, सभी साइटमैप की सूची बनाएं. इसके बाद, सूची वाली इस फ़ाइल को Google पर सबमिट करें.
  • अपने साइटमैप में सिर्फ़ कैननिकल यूआरएल की जानकारी दें. अगर आपके पास किसी पेज के दो वर्शन हैं, तो साइटमैप में सिर्फ़ उस वर्शन की जानकारी दें जिसे आप खोज के नतीजों में दिखाना चाहते हैं. अगर आपकी साइट के दो वर्शन हैं (उदाहरण के लिए, www और www के अलावा कोई और वर्शन), तो यह तय करें कि आपको कौनसी साइट ज़्यादा पसंद है. इसके बाद, साइटमैप को अपने पसंदीदा वर्शन में शामिल करें और rel=canonical या रीडायरेक्ट को दूसरी साइट में जोड़ें.
  • अगर आपके वेब पेज के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. हालांकि, अगर आप साइटमैप में दोनों यूआरएल के बारे में बताना चाहते हैं, तो दोनों यूआरएल के एनोटेशन दें और यह भी बताएं कि कौनसा यूआरएल, डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का.
  • वीडियो, इमेज, और समाचार जैसे किसी अन्य तरह के मीडिया के बारे में बताने के लिए, साइटमैप एक्सटेंशन का इस्तेमाल करें.
  • अगर अलग-अलग भाषाओं या इलाकों के लिए आपकी साइट के अलग-अलग पेज हैं, तो साइटमैप या एचटीएमएल टैग में hreflang का इस्तेमाल करके, आप इन अलग-अलग पेजों के यूआरएल के बारे में जानकारी दे सकते हैं.
  • बिना अक्षर और अंक वाले वर्ण और ऐसे वर्ण जो लैटिन भाषा में नहीं हैं. आपकी साइटमैप फ़ाइल UTF-8 कोड में बदली हुई होनी चाहिए (आप फ़ाइल सेव करते समय ऐसा कर सकते हैं). सभी एक्सएमएल फ़ाइलों की तरह, डेटा से जुड़ी किसी भी वैल्यू (जिसमें यूआरएल भी शामिल हैं) के लिए यह ज़रूरी है कि वह इस टेबल में मौजूद वर्णों के लिए एंटिटी एस्केप कोड का इस्तेमाल करे. साइटमैप में सिर्फ़ ASCII वर्ण शामिल किए जा सकते हैं; इसमें अंग्रेज़ी के बड़े अक्षरों वाले ASCII वर्ण, कुछ चुनिंदा कंट्रोल कोड या * और {} जैसे विशेष वर्ण शामिल नहीं किए जा सकते. अगर आपके साइटमैप के यूआरएल में ये वर्ण हैं, तो इसे जोड़ते समय आपको गड़बड़ी की सूचना मिलेगी.
    वर्ण एस्केप कोड
    एंपरसैंड & &amp;
    सिंगल कोट ' &apos;
    डबल कोट " &quot;
    इससे ज़्यादा > &gt;
    इससे कम < &lt;
    इसके अलावा, सभी यूआरएल (जिसमें आपके साइटमैप का यूआरएल भी शामिल है) को उस सर्वर के हिसाब से कोड में बदला जाना चाहिए जिस पर वे मौजूद हैं. साथ ही, उन्हें यूआरएल एस्केप भी किया जाना चाहिए. अगर आप यूआरएल बनाने के लिए किसी तरह की स्क्रिप्ट, टूल या लॉग फ़ाइल (उन्हें हाथ से टाइप करने के अलावा किसी भी तरीके से) का इस्तेमाल कर रहे हैं, तो आम तौर पर यह काम आपके लिए पहले ही किया जा चुका होता है. साइटमैप सबमिट करते समय, अगर आपको इस गड़बड़ी की सूचना मिलती है कि Google को आपके कुछ यूआरएल नहीं मिल रहे हैं, तो इस बात की अच्छी तरह से जांच कर लें कि आपके यूआरएल, यूआरआई के RFC-3986 स्टैंडर्ड, आईआरआई के RFC-3987 स्टैंडर्ड, और एक्सएमएल स्टैंडर्ड का पालन करते हैं या नहीं.

    यहां एक ऐसे यूआरएल का उदाहरण दिया गया है जो किसी ऐसे वर्ण का इस्तेमाल करता है जो ASCII कोड में शामिल नहीं है (जैसे कि ü). साथ ही, यह ऐसे किसी वर्ण (&) का भी इस्तेमाल करता है जिसके लिए एंटिटी एस्केप करने की ज़रूरत होती है:
    http://www.example.com/ümlat.html&q=name
    यहां वही यूआरएल, ISO-8859-1 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कि वही एन्कोडिंग इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:
    http://www.example.com/%FCmlat.html&q=name
    यहां वही यूआरएल, UTF-8 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कि वही एन्कोडिंग इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:
    http://www.example.com/%C3%BCmlat.html&q=name
    यहां वही यूआरएल, एंटिटी एस्केप करने के बाद दिया गया है:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • याद रखें कि साइटमैप, Google को दिए गए सुझाव होते हैं, जिनसे यह पता चलता है कि कौनसे पेज आपके लिए ज़्यादा ज़रूरी हैं; Google किसी साइटमैप में मौजूद हर यूआरएल को क्रॉल करने का वादा नहीं करता है.
  • Google, <priority> और <changefreq> वैल्यू को नज़रअंदाज़ कर देता है.
  • Google, <lastmod> वैल्यू का इस्तेमाल तब ही करता है, जब वैल्यू लगातार एक जैसी और पुष्टि करने पर (उदाहरण के लिए, पेज में पिछली बार किए गए बदलाव की तुलना करके) सटीक पाई जाती है.
  • साइटमैप में यूआरएल की पोज़िशन मायने नहीं रखती; Google, यूआरएल को उस क्रम में क्रॉल नहीं करता जिसमें वे आपके साइटमैप में दिखते हैं.

अपना साइटमैप Google को उपलब्ध कराना (अपना साइटमैप Google को सबमिट करना)

Google हर बार साइट क्रॉल करने पर साइटमैप की जांच नहीं करता; साइटमैप को सिर्फ़ पहली बार देखे जाने पर उसकी जांच की जाती है. इसके बाद, सिर्फ़ तब उसकी जांच होती है, जब आप हमें यह बताते हैं कि उसमें बदलाव हुआ है. आपको Google को साइटमैप के बारे में सिर्फ़ तब सूचना देनी चाहिए, जब वह नया हो या अपडेट किया गया हो; ऐसे साइटमैप बार-बार सबमिट या पिंग न करें जिनमें कोई भी बदलाव नहीं हुआ.

आप Google को अपना साइटमैप उपलब्ध करा सकें, इसके लिए कुछ तरीके यहां दिए गए हैं:

  • Search Console की साइटमैप रिपोर्ट का इस्तेमाल करके, इसे Google को सबमिट करें
  • अपने साइटमैप का पाथ बताते हुए robots.txt फ़ाइल में कहीं भी, यह लाइन डालें:
    Sitemap: http://example.com/sitemap_location.xml
  • Google से साइटमैप को क्रॉल करने का अनुरोध करने के लिए, "पिंग" सेवा का इस्तेमाल करें. एचटीटीपी GET अनुरोध कुछ इस तरह भेजें:
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    उदाहरण के लिए:
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

साइटमैप से जुड़ी समस्या हल करना

साइटमैप से जुड़ी समस्या हल करने वाली गाइड देखें.