साइटमैप बनाना और सबमिट करना

इस पेज पर साइटमैप बनाने और उसे Google के लिए उपलब्ध कराने का तरीका बताया गया है. साइटमैप के बारे में ज़्यादा जानें.

  1. यह तय करें कि Google को आपकी साइट के किस-किस पेज पर क्रॉल करना चाहिए. साथ ही, हर पेज का कैननिकल वर्शन भी तय कर लें.
  2. तय करें कि आप किस साइटमैप फ़ॉर्मैट का इस्तेमाल करना चाहते हैं. आप अपना साइटमैप मैन्युअल तरीके से बना सकते हैं. इसके अलावा, आप इसे बनाने के लिए, दिए गए तीसरे पक्ष के टूल में से किसी टूल का इस्तेमाल भी कर सकते हैं.
  3. अपने साइटमैप को Google के लिए उपलब्ध कराने के लिए, इसे अपनी robots.txt फ़ाइल में जोड़ें या सीधे Search Console में सबमिट करें.

साइटमैप के फ़ॉर्मैट

Google पर साइटमैप के कई फ़ॉर्मैट इस्तेमाल किए जा सकते हैं. इन फ़ॉर्मैट के बारे में यहां बताया गया है. Google पर सभी फ़ॉर्मैट के लिए, स्टैंडर्ड साइटमैप प्रोटोकॉल का इस्तेमाल किया जाना चाहिए. Google, फ़िलहाल साइटमैप में <priority> एट्रिब्यूट का इस्तेमाल नहीं करता है.

सभी फ़ॉर्मैट में, एक साइटमैप का साइज़ 50 एमबी (बिना कंप्रेस किए) या उससे कम होना चाहिए. साथ ही, उसमें यूआरएल की कुल संख्या 50,000 से ज़्यादा नहीं होनी चाहिए. अगर आपकी फ़ाइल का साइज़ इससे बड़ा है या आपके पास इससे ज़्यादा यूआरएल हैं, तो आपको अपनी सूची को कई साइटमैप में बांटना होगा. इसके अलावा, आप एक साइटमैप इंडेक्स फ़ाइल (एक ऐसी फ़ाइल जिसमें साइटमैप की सूची शामिल होती है) बनाकर, उसे Google को सबमिट कर सकते हैं. आप Google को एक से ज़्यादा साइटमैप और/या साइटमैप इंडेक्स फ़ाइलें सबमिट कर सकते हैं.

एक्सएमएल

यहां एक बुनियादी एक्सएमएल साइटमैप दिया गया है, जिसमें एक यूआरएल की जगह की जानकारी शामिल है:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
   <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

आप sitemaps.org पर बेहतर उदाहरण और पूरा दस्तावेज़ देख सकते हैं.

आप किसी दूसरी भाषा के पेजों के बारे में बताने वाले साइटमैप और समाचार, इमेज या वीडियो फ़ाइल के लिए साइटमैप के उदाहरण देख सकते हैं.

आरएसएस, एमआरएसएस, और ऐटम 1.0

अगर आपके ब्लॉग में आरएसएस या ऐटम फ़ीड शामिल है, तो आप फ़ीड के यूआरएल को साइटमैप के तौर पर सबमिट कर सकते हैं. ज़्यादातर ब्लॉग सॉफ़्टवेयर आपके लिए फ़ीड बना सकते हैं, लेकिन इस बात का ध्यान रखें कि यह फ़ीड सिर्फ़ हाल ही के यूआरएल की जानकारी देता है.

  • Google पर आरएसएस 2.0 और ऐटम 1.0 फ़ीड का इस्तेमाल किया जा सकता है.
  • आप Google को अपनी साइट पर मौजूद वीडियो की जानकारी देने के लिए, एमआरएसएस (मीडिया आरएसएस) फ़ीड का इस्तेमाल कर सकते हैं.

टेक्स्ट

अगर आपके साइटमैप में सिर्फ़ वेब पेज से जुड़े यूआरएल शामिल हैं, तो आप Google को एक ऐसी सामान्य टेक्स्ट फ़ाइल भेज सकते हैं जिसमें सभी यूआरएल एक के बाद एक, अलग-अलग लाइन में लिखे हों. उदाहरण के लिए:

http://www.example.com/file1.html
http://www.example.com/file2.html

टेक्स्ट फ़ाइल वाले साइटमैप के लिए दिशा-निर्देश:

  • UTF-8 एन्कोडिंग का इस्तेमाल करके, अपनी फ़ाइल को कोड में बदलें.
  • आपकी टेक्स्ट फ़ाइल में यूआरएल की सूची के अलावा कुछ नहीं होना चाहिए.
  • आप टेक्स्ट फ़ाइल को अपनी पसंद का कोई भी नाम दे सकते हैं, लेकिन ध्यान रखें कि उसका एक्सटेंशन .txt हो (जैसे कि sitemap.txt).

Google Sites

अगर आपने Google Sites का इस्तेमाल करके कोई साइट बनाई है और उसकी पुष्टि की है, तो Google Sites से आपके लिए अपने-आप एक साइटमैप बनकर तैयार हो जाएगा. आप इस साइटमैप में बदलाव नहीं कर सकते. हालांकि, साइटमैप की रिपोर्ट से जुड़ा डेटा देखने के लिए, आप इसे Google को सबमिट कर सकते हैं. ध्यान रखें कि अगर आपके पास किसी सब-डायरेक्ट्री में 1,000 से ज़्यादा पेज हैं, तो शायद आपका साइटमैप ठीक से न दिखे.

  • अगर आपकी साइट Google Sites पर होस्ट की जाती है, तो आपके साइटमैप का यूआरएल http://sites.google.com/site/yoursitename/system/feeds/sitemap होगा
  • अगर आपने Google Workspace का इस्तेमाल करके अपनी साइट बनाई है, तो आपके साइटमैप का यूआरएल https://sites.google.com/yourdomain/yoursitename/system/feeds/sitemap होगा

अन्य तरह के मीडिया के लिए साइटमैप के एक्सटेंशन

यहां दिए गए अलग-अलग तरह के मीडिया के लिए, Google पर एक्सटेंशन से जुड़े साइटमैप सिंटैक्स का इस्तेमाल किया जा सकता है. अपनी साइट पर मौजूद वीडियो फ़ाइलों, इमेज, और पार्स करने में मुश्किल कॉन्टेंट के बारे में बताने के लिए इन एक्सटेंशन का इस्तेमाल करें. इससे इन संसाधनों को बेहतर तरीके से इंडेक्स किया जा सकेगा.

साइटमैप से जुड़े सामान्य दिशा-निर्देश

  • ऐसे यूआरएल इस्तेमाल करें जो साइट के नाम जैसे ही हों और सभी शर्तें पूरी करते हों. Google आपके यूआरएल को ठीक वैसे ही क्रॉल करेगा जैसे उन्हें लिस्ट किया गया होगा. उदाहरण के लिए, अगर आपकी साइट https://www.example.com/ पर है, तो यूआरएल को https://example.com/ (www मौजूद नहीं है) या ./mypage.html (एक मिलते-जुलते यूआरएल) के तौर पर न दिखाएं.
  • साइटमैप को आपकी साइट पर कहीं भी पोस्ट किया जा सकता है, लेकिन साइटमैप सिर्फ़ पैरंट डायरेक्ट्री या उसके नीचे के लेवल पर ही असर डालता है. इसलिए, साइट रूट पर पोस्ट किया गया साइटमैप, साइट की सभी फ़ाइलों पर असर डाल सकता है. यही वह जगह है जहां हम साइटमैप पोस्ट करने का सुझाव देते हैं.
  • यूआरएल की डुप्लीकेट क्रॉलिंग कम करने के मकसद से, अपने साइटमैप में यूआरएल के सत्र आईडी शामिल न करें.
  • hreflang व्याख्याओं की मदद से Google को किसी यूआरएल के दूसरी भाषाओं के वर्शन के बारे में बताएं.
  • यह ज़रूरी है कि साइटमैप फ़ाइलों को UTF-8 कोड में बदला गया हो. साथ ही, उन्हें ठीक तरह से यूआरएल एस्केप किया गया हो.
  • बड़े साइटमैप को छोटे साइटमैप में बांटें: बिना कंप्रेस किए गए साइटमैप का साइज़ ज़्यादा से ज़्यादा 50 एमबी होता है या इसमें ज़्यादा से ज़्यादा 50,000 यूआरएल होते हैं. अलग-अलग साइटमैप सबमिट करने के बजाय, साइटमैप इंडेक्स फ़ाइल का इस्तेमाल करके सभी साइटमैप की सूची बनाएं. इसके बाद, इस फ़ाइल को Google पर सबमिट करें.
  • अपने साइटमैप में सिर्फ़ कैननिकल यूआरएल की जानकारी दें. अगर आपके पास किसी पेज के दो वर्शन हैं, तो साइटमैप में सिर्फ़ (Google के चुने हुए) कैननिकल वर्शन की जानकारी दें. अगर आपकी साइट के दो वर्शन हैं (उदाहरण के लिए, www और www के अलावा कोई और वर्शन), तो यह तय करें कि आपको कौनसी साइट ज़्यादा पसंद है. इसके बाद, अपने पसंदीदा वर्शन में साइटमैप शामिल करें और rel=canonical जोड़ें या दूसरी साइट पर रीडायरेक्ट करें.
  • अगर आपके वेब पेज के मोबाइल और डेस्कटॉप वर्शन के यूआरएल अलग-अलग हैं, तो हमारा सुझाव है कि आप साइटमैप में सिर्फ़ एक वर्शन के बारे में बताएं. हालांकि, अगर आप साइटमैप में दोनों यूआरएल के बारे में बताना चाहते हैं, तो दोनों यूआरएल लिखें और यह भी बताएं कि कौनसा यूआरएल, डेस्कटॉप वर्शन का है और कौनसा मोबाइल वर्शन का.
  • वीडियो, इमेज, और समाचार जैसे किसी अन्य तरह के मीडिया के बारे में बताने के लिए, साइटमैप एक्सटेंशन का इस्तेमाल करें.
  • अगर अलग-अलग भाषाओं या इलाकों के लिए आपकी साइट के अलग-अलग पेज हैं, तो साइटमैप या एचटीएमएल टैग में hreflang का इस्तेमाल करके, आप इन अलग-अलग पेजों के यूआरएल के बारे में जानकारी दे सकते हैं.
  • ऐसे वर्ण जो अक्षर या अंक नहीं हैं या फिर लैटिन भाषा में नहीं हैं. आपकी साइटमैप फ़ाइल UTF-8 कोड में बदली हुई होनी चाहिए (आप फ़ाइल सेव करते समय ऐसा कर सकते हैं). सभी एक्सएमएल फ़ाइलों की तरह, डेटा से जुड़े किसी भी मान (जिसमें यूआरएल भी शामिल हैं) के लिए यह ज़रूरी है कि वह इस टेबल में मौजूद वर्णों के लिए एंटिटी एस्केप कोड का इस्तेमाल करे. साइटमैप में सिर्फ़ ASCII वर्ण ही शामिल किए जा सकते हैं; इसमें अंग्रेज़ी (रोमन स्क्रिप्ट) के बड़े अक्षरों वाले ASCII वर्ण, कुछ चुनिंदा कंट्रोल कोड या विशेष वर्ण, जैसे कि * और {} शामिल नहीं किए जा सकते. अगर आपके साइटमैप के यूआरएल में ये वर्ण हैं, तो इसे जोड़ते समय कोई गड़बड़ी दिखेगी.
    वर्ण एस्केप कोड
    एम्परसैंड & &amp;
    सिंगल कोट ' &apos;
    डबल कोट " &quot;
    इससे ज़्यादा > &gt;
    इससे कम < &lt;
    इसके अलावा, सभी यूआरएल (जिसमें आपके साइटमैप का यूआरएल भी शामिल है) को उस सर्वर के हिसाब से कोड में बदला जाना चाहिए जिस पर वे मौजूद हैं. साथ ही, उन्हें यूआरएल एस्केप भी किया जाना चाहिए. अगर आप यूआरएल बनाने के लिए किसी तरह की स्क्रिप्ट, टूल या लॉग फ़ाइल (उन्हें हाथ से टाइप करने के अलावा किसी भी तरीके से) का इस्तेमाल कर रहे हैं, तो आम तौर पर यह काम आपके लिए पहले ही किया जा चुका होता है. साइटमैप सबमिट करते समय, अगर आपको इस गड़बड़ी की सूचना मिलती है कि Google को आपके कुछ यूआरएल नहीं मिल रहे हैं, तो इस बात की अच्छी तरह से जांच कर लें कि आपके यूआरएल, यूआरआई के RFC-3986 स्टैंडर्ड, आईआरआई के RFC-3987 स्टैंडर्ड, और एक्सएमएल स्टैंडर्ड का पालन करते हैं या नहीं.

    यहां एक ऐसे यूआरएल का उदाहरण दिया गया है जो किसी ASCII के अलावा किसी और वर्ण (ü) का इस्तेमाल करता है. साथ ही, यह एक ऐसे वर्ण (&) का भी इस्तेमाल करता है जिसके लिए एंटिटी एस्केप करने की ज़रूरत होती है:
    http://www.example.com/ümlat.html&q=name
    यहां वही यूआरएल, ISO-8859-1 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कोड में बदलने के लिए इस तरीके का इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:
    http://www.example.com/%FCmlat.html&q=name
    यहां वही यूआरएल, UTF-8 कोड में बदलकर (ऐसे सर्वर पर होस्ट किए जाने के लिए जो कोड में बदलने के लिए इस तरीके का इस्तेमाल करता है) और यूआरएल एस्केप करने के बाद दिया गया है:
    http://www.example.com/%C3%BCmlat.html&q=name
    यहां वही यूआरएल, एंटिटी एस्केप करने के बाद दिया गया है:
    http://www.example.com/%C3%BCmlat.html&amp;q=name
  • याद रखें कि साइटमैप, Google को दिए गए सुझाव होते हैं जिनसे यह पता चलता है कि कौनसे पेज आपके लिए ज़्यादा ज़रूरी हैं; Google किसी साइटमैप में मौजूद हर यूआरएल को क्रॉल करने का वादा नहीं करता है.
  • Google, <priority> और <changefreq> मानों को नज़रअंदाज़ कर देता है, इसलिए उन्हें न जोड़ें.
  • Google <lastmod> मान को पढ़ता है, लेकिन अगर आप गलत मान पेश करते हैं, तो हम उसे पढ़ना बंद कर देंगे.
  • साइटमैप में यूआरएल की पोज़िशन मायने नहीं रखती है; Google, यूआरएल को उस क्रम में क्रॉल नहीं करता जिसमें वे आपके साइटमैप में दिखते हैं.

अपना साइटमैप Google को उपलब्ध कराना (अपना साइटमैप Google को सबमिट करना)

Google हर बार साइट क्रॉल करने पर साइटमैप की जांच नहीं करता; साइटमैप को सिर्फ़ पहली बार देखे जाने पर ही उसकी जांच की जाती है. इसके बाद, सिर्फ़ तब उसकी जांच होती है, जब आप हमें यह बताते हैं कि उसमें बदलाव हुआ है. आपको Google को साइटमैप के बारे में सिर्फ़ तभी सूचना देनी चाहिए, जब यह नया हो या अपडेट किया गया हो; ऐसे साइटमैप बार-बार सबमिट या पिंग न करें जिनमें कोई भी बदलाव नहीं हुआ.

Google को अपना साइटमैप उपलब्ध करवाने के कुछ तरीके ये हैं:

  • Search Console के साइटमैप टूल का इस्तेमाल करके, इसे Google को सबमिट करें
  • अपने साइटमैप का पाथ बताने के लिए, अपनी robots.txt फ़ाइल में कहीं भी यह लाइन डालें:
    Sitemap: http://example.com/sitemap_location.xml
  • हमसे अपने साइटमैप को क्रॉल करवाने के लिए, "पिंग" फ़ंक्शन का इस्तेमाल करें. एचटीटीपी GET अनुरोध कुछ इस तरह भेजें:
    http://www.google.com/ping?sitemap=<complete_url_of_sitemap>
    उदाहरण के लिए:
    http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

साइटमैप से जुड़ी समस्या हल करना

साइटमैप से जुड़ी समस्या हल करने वाली गाइड देखें.