डेटासेट

डेटासेट के बारे में अलग से दूसरी जानकारी देने पर उन्हें ढूंढना आसान हो जाता है. यह दूसरी जानकारी स्ट्रक्चर्ड डेटा के तौर पर उनके नाम, ब्यौरे, क्रिएटर, और बंटवारे के फ़ॉर्मैट दी जाती है. Google डेटासेट खोजने के अपने तरीके में schema.org और उन दूसरे मेटाडेटा मानकों का इस्तेमाल करता है जिन्हें डेटासेट की जानकारी देने वाले पेजों में जोड़ा जा सकता है. इस मार्कअप का मकसद चिकित्सा विज्ञान, सामाजिक विज्ञान, मशीन लर्निंग, नागरिक, और सरकारी डेटा जैसे फ़ील्ड से डेटासेट खोजने की सुविधा को बेहतर बनाना है. आप डेटासेट सर्च टूल का इस्तेमाल करके डेटासेट ढूंढ सकते हैं.

Dataset Search का उदाहरण

यहां कुछ ऐसी चीज़ों के उदाहरण दिए गए हैं जिन्हें डेटासेट के तौर पर इस्तेमाल किया जा सकता है:

  • कुछ डेटा वाली टेबल या CSV फ़ाइल
  • टेबल का व्यवस्थित संग्रह
  • मालिकाना फ़ॉर्मैट में ऐसी फ़ाइल जिसमें डेटा मौजूद हो
  • फ़ाइलों का ऐसा संग्रह, जो एक साथ मिलकर कुछ बेहतर डेटासेट तैयार कर सके
  • किसी दूसरे फ़ॉर्मैट में मौजूद, डेटा के साथ ऐसा स्ट्रक्चर्ड ऑब्जेक्ट जिसे प्रॉसेस करने के लिए आप शायद किसी खास टूल में लोड करना चाहें
  • इमेज कैप्चर करने वाला डेटा
  • मशीन लर्निंग से जुड़ी फ़ाइलें, जैसे, तैयार किए गए पैरामीटर या न्यूरल नेटवर्क स्ट्रक्चर की परिभाषाएं
  • ऐसी कोई भी चीज़, जो आपको डेटासेट की तरह लगती हो

स्ट्रक्चर्ड डेटा को जोड़ने का तरीका

स्ट्रक्चर्ड डेटा, किसी पेज के बारे में जानकारी देने और पेज के कॉन्टेंट को श्रेणियों में बाँटने का एक मानक फ़ॉर्मैट है. अगर आप स्ट्रक्चर्ड डेटा के बारे में ज़्यादा नहीं जानते, तो स्ट्रक्चर्ड डेटा के काम करने का तरीका पर जाकर इसके बारे में ज़्यादा जान सकते हैं.

स्ट्रक्चर्ड डेटा बनाने, उसकी जांच करने, और उसे रिलीज़ करने के बारे में खास जानकारी यहां दी गई है. वेब पेज में स्ट्रक्चर्ड डेटा जोड़ने के सिलसिलेवार निर्देशों के लिए, स्ट्रक्चर्ड डेटा कोडलैब (कोड बनाना सीखना) देखें.

  1. ज़रूरी प्रॉपर्टी जोड़ें. पेज पर स्ट्रक्चर्ड डेटा कहां जोड़ना चाहिए, इस बारे में जानकारी पाने के लिए, JSON-LD स्ट्रक्चर्ड डेटा: इसे पेज पर कहां डाला जाए देखें.
  2. दिशा-निर्देशों का पालन करें.
  3. ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) के टेस्ट का इस्तेमाल करके अपने कोड की पुष्टि करें.
  4. स्ट्रक्चर्ड डेटा वाले कुछ पेजों को डिप्लॉय करें. इसके बाद, यूआरएल जांचने वाला टूल इस्तेमाल करके जांचें कि Google को पेज कैसा दिखेगा. पक्का करें कि Google आपका पेज ऐक्सेस कर सकता है. उसे robots.txt फ़ाइल से रोका न गया हो और noindex टैग इस्तेमाल करना या लॉग इन करना ज़रूरी न हो. अगर पेज ठीक दिखता है, तो आप Google को अपने यूआरएल फिर से क्रॉल करने के लिए कह सकते हैं.
  5. Google को आने वाले समय में होने वाले बदलावों की जानकारी देने के लिए, हमारा सुझाव है कि आप साइटमैप सबमिट करें. आप Search Console साइटमैप एपीआई की मदद से इसे अपने-आप चलने दे सकते हैं.

डेटासेट खोजने का हमारा तरीका

हम डेटासेट के बारे में, वेब पेजों पर मौजूद स्ट्रक्चर्ड डेटा को समझ सकते हैं. इसे समझने के लिए, हम schema.org Dataset मार्कअप या W3C के डेटा कैटलॉग शब्दावली (डीसीएटी) फ़ॉर्मैट में पेश किए गए उसी के जैसे स्ट्रक्चर का इस्तेमाल करते हैं. हम W3C CSVW के आधार पर स्ट्रक्चर्ड डेटा के लिए प्रयोग के तौर पर सुविधाओं की खोज भी कर रहे हैं. हम डेटासेट की जानकारी देने के लिए और भी बेहतर काम करना चाहते हैं. साथ ही, हमारे तरीके को सबसे अच्छे तरीके के तौर पर अपनाए जाने की उम्मीद करते हैं. हम डेटासेट ढूंढने के लिए किस तरीके का इस्तेमाल करते हैं, इस बारे में ज़्यादा जानने के लिए, डेटासेट ढूंढना आसान बनाना देखें.

उदाहरण

ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में, JSON-LD और schema.org सिंटैक्स (पसंदीदा) का इस्तेमाल करने वाले डेटासेट का उदाहरण यहां दिया गया है. उसी schema.org शब्दावली का इस्तेमाल RDFa 1.1 या माइक्रोडेटा सिंटैक्स में भी किया जा सकता है. आप मेटाडेटा के बारे में बताने के लिए, W3C DCAT शब्दावली का भी इस्तेमाल कर सकते हैं. नीचे दिया गया उदाहरण असल डेटासेट की जानकारी पर आधारित है.

JSON-LD

JSON-LD में डेटासेट का एक उदाहरण यहां दिया गया है:


  <html>
  <head>
    <title>NCDC Storm Events Database</title>
    <script type="application/ld+json">
    {
      "@context":"https://schema.org/",
      "@type":"Dataset",
      "name":"NCDC Storm Events Database",
      "description":"Storm Data is provided by the National Weather Service (NWS) and contain statistics on...",
      "url":"https://catalog.data.gov/dataset/ncdc-storm-events-database",
      "sameAs":"https://gis.ncdc.noaa.gov/geoportal/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510",
      "identifier": ["https://doi.org/10.1000/182",
                     "https://identifiers.org/ark:/12345/fk1234"],
      "keywords":[
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > CYCLONES",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > DROUGHT",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FOG",
         "ATMOSPHERE > ATMOSPHERIC PHENOMENA > FREEZE"
      ],
      "license" : "https://creativecommons.org/publicdomain/zero/1.0/",
      "hasPart" : [
        {
          "@type": "Dataset",
          "name": "Sub dataset 01",
          "description": "Informative description of the first subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        },
        {
          "@type": "Dataset",
          "name": "Sub dataset 02",
          "description": "Informative description of the second subdataset...",
          "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
        }
      ],
      "creator":{
         "@type":"Organization",
         "url": "https://www.ncei.noaa.gov/",
         "name":"OC/NOAA/NESDIS/NCEI > National Centers for Environmental Information, NESDIS, NOAA, U.S. Department of Commerce",
         "contactPoint":{
            "@type":"ContactPoint",
            "contactType": "customer service",
            "telephone":"+1-828-271-4800",
            "email":"ncei.orders@noaa.gov"
         }
      },
      "includedInDataCatalog":{
         "@type":"DataCatalog",
         "name":"data.gov"
      },
      "distribution":[
         {
            "@type":"DataDownload",
            "encodingFormat":"CSV",
            "contentUrl":"http://www.ncdc.noaa.gov/stormevents/ftp.jsp"
         },
         {
            "@type":"DataDownload",
            "encodingFormat":"XML",
            "contentUrl":"http://gis.ncdc.noaa.gov/all-records/catalog/search/resource/details.page?id=gov.noaa.ncdc:C00510"
         }
      ],
      "temporalCoverage":"1950-01-01/2013-12-18",
      "spatialCoverage":{
         "@type":"Place",
         "geo":{
            "@type":"GeoShape",
            "box":"18.0 -65.0 72.0 172.0"
         }
      }
    }
    </script>
  </head>
  <body>
  </body>
</html>
RDFa

RDFa में DCAT शब्दावली का इस्तेमाल करने वाले डेटासेट का एक उदाहरण यहां दिया गया है:


<article about="/node/1234" typeof="dcat:Dataset">
    <dl>
      <dt>Name:</dt>
      <dd property="dc:title">ACME Inc Cash flow data</dd>
      <dt>Identifiers:</dt>
      <dd property="dc:identifier">https://doi.org/10.1000/182</dd>
      <dd property="dc:identifier">https://identifiers.org/ark:/12345/fk1234</dd>
      <dt>Description:</dt>
      <dd property="dc:description">Financial Statements - Consolidated Statement of Cash Flows</dd>
      <dt>Category:</dt>
      <dd rel="dc:subject">Financial</dd>
      <dt class="field-label">Downloads:</dt>
      <dd>
        <ul>
          <li>
            <a rel="dcat:distribution" href="Consolidated_Statement_of_Cash_Flows_en.csv"><span property="dcat:mediaType" content="text/csv" >Consolidated_Statement_of_Cash_Flows_en.csv</span></a>
          </li>
         <li>
            <a rel="dcat:distribution"  href="files/Consolidated_Statement_of_Cash_Flows_en.xls"><span property="dcat:mediaType" content="application/vnd.ms-excel">Consolidated_Statement_of_Cash_Flows_en.xls</span></a>
          </li>
          <li>
            <a rel="dcat:distribution"  href="files/consolidated_statement_of_cash_flows_en.xml"><span property="dcat:mediaType" content="application/xml">consolidated_statement_of_cash_flows_en.xml</span></a>
          </li>
        </ul>
      </dd>
    </dl>
  </article>

दिशा-निर्देश

साइटों के लिए स्ट्रक्चर्ड डेटा के दिशा-निर्देशों का पालन करना चाहिए. स्ट्रक्चर्ड डेटा के दिशा-निर्देशों के अलावा, हम नीचे दिए गए साइटमैप और स्रोत और मूल जगह के सबसे अच्छे तरीके अपनाने का सुझाव देते हैं.

साइटमैप इस्तेमाल करने के सबसे अच्छे तरीके

साइटमैप फ़ाइल का इस्तेमाल करें, ताकि Google को आपके यूआरएल ढूंढने में मदद मिल सके. साइटमैप फ़ाइल और sameAs मार्कअप का इस्तेमाल करने से, आपकी साइट पर डेटासेट की जानकरी प्रकाशित करने का रिकॉर्ड रखने में मदद मिलती है.

अगर आपके पास डेटासेट रिपॉज़िटरी (डेटा संग्रह की जगह) है, तो आपके पास कम से कम दो तरह के पेज हो सकते हैं: हर डेटासे के लिए कैननिकल ("लैंडिंग") पेज और एक से ज़्यादा डेटासेट वाले पेज (जैसे कि, खोज नतीजे या डेटासेट के कुछ सबसेट). हमारा सुझाव है कि आप कैननिकल पेज में डेटासेट के बारे में स्ट्रक्चर्ड डेटा जोड़ें. अगर आप डेटासेट की एक से ज़्यादा कॉपी में स्ट्रक्चर्ड डेटा (यानी खोज नतीजों के पेज में सूचियां) जोड़ते हैं, तो कैननिकल पेज से लिंक करने के लिए sameAs प्रॉपर्टी का इस्तेमाल करें.

स्रोत और मूल जगह के लिए सबसे अच्छे तरीके

खुले डेटासेट को फिर से प्रकाशित करना, इकट्ठा करना, और दूसरे डेटासेट के आधार पर तैयार करना सामान्य बात है. यह स्थितियों को दिखाने के हमारे तरीके का शुरुआती हिस्सा है. इसमें डेटासेट को किसी दूसरे डेटासेट की कॉपी करके या दूसरे डेटासेट के आधार पर अलग तरीके से बनाया जाता है.

  • जब डेटासेट या दी गई जानकारी को कहीं और प्रकाशित की गई सामग्रियों की कॉपी करके फिर से प्रकाशित करना हो, तो मूल डेटासेट के सबसे ज़्यादा कैननिकल यूआरएल दिखाने के लिए sameAs प्रॉपर्टी का इस्तेमाल करें. sameAs का मान साफ़ तौर पर डेटासेट की पहचान बताने वाला होना चाहिए. दूसरे शब्दों में कहें, तो अलग-अलग डेटासेट को sameAs मान में दिए गए यूआरएल का इस्तेमाल नहीं करना चाहिए.
  • अगर फिर से प्रकाशित किए गए डेटासेट (और उसके मेटाडेटा) में बहुत सारे बदलाव किए गए हैं, तो isBasedOn प्रॉपर्टी का इस्तेमाल करें.
  • जब डेटासेट के बारे में जानकारी कई मूल डेटासेट से ली गई हो या इकट्ठा की गई हो, तो isBasedOn प्रॉपर्टी का इस्तेमाल करें.
  • किसी भी ज़रूरी डिजिटल ऑब्जेक्ट पहचानकर्ता (डीओआई) या कॉम्पैक्ट पहचानकर्ता को अटैच करने के लिए, identifier प्रॉपर्टी का इस्तेमाल करें. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता हैं, तो identifier प्रॉपर्टी को एक से ज़्यादा बार इस्तेमाल करें. अगर आप JSON-LD का इस्तेमाल कर रहे हैं, तो यह JSON सूची के सिंटैक्स का इस्तेमाल करके दिखाया जाता है.

हम सुझावों के आधार पर अपनी सलाह को बेहतर बनाने की उम्मीद करते हैं. खास तौर पर ऐसे सुझाव जो मूल जगह, वर्शन, और टाइम सीरीज़ के प्रकाशन से जुड़ी तारीखों की जानकारी के बारे में हैं. कृपया समुदाय की चर्चाओं में शामिल हों.

टेक्स्ट प्रॉपर्टी के लिए सुझाव

हम टेक्स्ट वाली सभी प्रॉपर्टी को 5000 या इससे कम वर्णों तक सीमित रखने का सुझाव देते हैं. 'Google डेटासेट सर्च' किसी भी टेक्स्ट वाली प्रॉपर्टी के पहले 5000 वर्णों का ही इस्तेमाल करता है. नाम और शीर्षक आम तौर पर कुछ शब्दों के या एक छोटे वाक्य के होते हैं.

पहले से जानकारी वाली गड़बड़ियां और चेतावनियां

आपको Google के स्ट्रक्चर्ड डेटा टेस्टिंग टूल और पुष्टि के दूसरे सिस्टम में गड़बड़ियां या चेतावनियां मिल सकती हैं. खास तौर पर, पुष्टि करने वाले सिस्टम सुझाव दे सकते हैं कि संगठनों की संपर्क जानकारी नहीं होनी चाहिए जिसमें contactType भी शामिल है. काम के मान customer service, emergency, journalist, newsroom, और public engagement होते हैं. आप csvw:Table की गड़बड़ियों को mainEntity प्रॉपर्टी के अनचाहे मान के तौर पर अनदेखा भी कर सकते हैं.

अलग-अलग तरह के स्ट्रक्चर्ड डेटा की जानकारी

आपका कॉन्टेंट ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) के तौर पर दिखाई दे, इसके लिए आपको ज़रूरी प्रॉपर्टी जोड़नी होंगी. अपने कॉन्टेंट के बारे में ज़्यादा जानकारी जोड़ने के लिए, आप सुझाई गई प्रॉपर्टी भी शामिल कर सकते हैं. इससे उपयोगकर्ता को बेहतर अनुभव मिल सकता है.

अपने मार्कअप की पुष्टि करने के लिए, आप स्ट्रक्चर्ड डेटा की जांच करने वाले टूल का इस्तेमाल कर सकते हैं.

इसमें डेटासेट (उसके मेटाडेटा) और उसकी सामग्रियों को दिखाने के बारे में जानकारी देने पर खास तौर से ध्यान दिया जाता है. जैसे कि, डेटासेट का मेटाडेटा उसके बारे में जानकारी देता है. इससे पता चलता है कि यह किस वैरिएबल के लिए काम करता है, इसे किसने बनाया है वगैरह. यानी, इसमें वैरिएबल के लिए खास मान शामिल नहीं होते हैं.

Dataset

Dataset की पूरी जानकारी, schema.org/Dataset पर मौजूद है.

आप डेटासेट के प्रकाशन के बारे में ज़्यादा जानकारी दे सकते हैं, जैसे कि लाइसेंस, प्रकाशित करने की तारीख, इसका डीओआई या किसी अलग रिपॉज़िटरी (डेटा संग्रह की जगह) में डेटासेट के कैननिकल वर्शन के बारे में बताने वाली sameAs. मूल जगह और लाइसेंस की जानकारी देने वाले डेटासेट के लिए identifier, license, और sameAs जोड़ें.

ज़रूरी प्रॉपर्टी
description Text

डेटासेट के बारे में कम शब्दों में खास जानकारी.

दिशा-निर्देश

  • यह जानकारी 50 से 5000 वर्णों की होनी चाहिए.
  • जानकारी में मार्कडाउन सिंटैक्स शामिल हो सकता है. एम्बेड की गई इमेज के लिए सही यूआरएल का पाथ इस्तेमाल किया जाना चाहिए (बजाय इसके कि इमेज से सही यूआरएल पाथ की जगह उससे मिलते-जुलते पाथ का इस्तेमाल किया जाए).
  • JSON-LD फ़ॉर्मैट का इस्तेमाल करने पर, नई लाइन को \n (दो वर्ण: बैकस्लैश और लोअर केस में अंग्रेज़ी के वर्ण "n") से बताएं.
name Text

डेटासेट की जानकारी देने वाला नाम. जैसे कि, "उत्तरी गोलार्ध में बर्फ़ की मोटाई".

सुझाई गई प्रॉपर्टी
alternateName Text

इस डेटासेट के बारे में जानकारी देने वाले वैकल्पिक नाम, जैसे कि उपनाम या छोटा नाम. उदाहरण (JSON-LD फ़ॉर्मैट में):

"name": "The Quick, Draw! Dataset"
"alternateName": ["Quick Draw Dataset", "quickdraw-dataset"]
creator Person या Organization

यह डेटासेट बनाने वाला. व्यक्ति की खास पहचान करने के लिए, Person तरह की sameAs प्रॉपर्टी के मान में ORCID ID का इस्तेमाल करें. संस्थानों और संगठनों की खास पहचान करने के लिए, ROR ID का इस्तेमाल करें. उदाहरण (JSON-LD फ़ॉर्मैट में):

"creator": [
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0000",
        "givenName": "Jane",
        "familyName": "Foo",
        "name": "Jane Foo"
    },
    {
        "@type": "Person",
        "sameAs": "http://orcid.org/0000-0000-0000-0001",
        "givenName": "Jo",
        "familyName": "Bar",
        "name": "Jo Bar"
    },
    {
        "@type": "Organization",
        "sameAs": "http://ror.org/xxxxxxxxx",
        "name": "Fictitious Research Consortium"
    }
]
citation Text या CreativeWork

शैक्षणिक लेखों की पहचान करता है जिसका सुझाव डेटा उपलब्ध कराने वाले व्यक्ति ने दिया हो. इसका मकसद उपयोगकर्ताओं को डेटासेट के साथ इन लेखों का सुझाव देना है. दूसरी प्रॉपर्टी से डेटासेट के बारे में जानकारी दें, जैसे कि name, identifier, creator, और publisher प्रॉपर्टी. उदाहरण के लिए, इस प्रॉपर्टी में डेटासेट से मिलते-जुलते खास शैक्षणिक प्रकाशन के बारे में जानकारी दी जा सकती है. जैसे, डेटा की जानकारी देने वाला दस्तावेज़, डेटा पेपर या ऐसा लेख जिससे डेटासेट को बेहतर तरीके से समझा जा सके. उदाहरण (JSON-LD फ़ॉर्मैट में):

"citation": "https://doi.org/10.1111/111"
"citation": "https://identifiers.org/pubmed:11111111"
"citation": "https://identifiers.org/arxiv:0111.1111v1"
"citation":
 "Doe J (2014) Influence of X ... https://doi.org/10.1111/111"

अन्य दिशा-निर्देश

  • डेटासेट के बारे में उद्धरण की जानकारी देने के लिए इस प्रॉपर्टी का इस्तेमाल न करें. इस फ़ील्ड का मकसद डेटासेट से मिलते-जुलते शैक्षणिक लेखों को पहचानना है, न कि डेटासेट के बारे में जानकारी देना. डेटासेट को बेहतर तरीके से समझने के लिए ज़रूरी जानकारी देने के लिए, name, identifier, creator, और publisher प्रॉपर्टी इस्तेमाल करें.
  • हवाला देने वाली प्रॉपर्टी में हवाला देने वाला स्निपेट डालते समय, जहां भी हो सके वहां लेख की पहचान करने वाली जानकारी (जैसे, डीओआई) ज़रूर दें.

    सुझाया गया: "Doe J (2014) Influence of X. Biomics 1(1). https://doi.org/10.1111/111"

    इसका सुझाव नहीं दिया जाता: "Doe J (2014) Influence of X. Biomics 1(1)."

hasPart या isPartOf URL या Dataset

अगर कोई डेटासेट छोटे-छोटे डेटासेट का संग्रह हो, तो ऐसा संबंध बताने के लिए hasPart प्रॉपर्टी का इस्तेमाल करें. इसके उलट, अगर कोई डेटासेट बड़े डेटासेट का हिस्सा है, तो isPartOf का इस्तेमाल करें. दोनों प्रॉपर्टी एक यूआरएल या एक Dataset इंस्टेंस के रूप में हो सकती है. अगर Dataset का इस्तेमाल मान के रूप में किया जाता है, तो इसमें स्टैंडअलोन Dataset के लिए ज़रूरी सभी प्रॉपर्टी शामिल होनी चाहिए. उदाहरण:

"hasPart" : [
  {
    "@type": "Dataset",
    "name": "Sub dataset 01",
    "description": "Informative description of the first subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  },
  {
    "@type": "Dataset",
    "name": "Sub dataset 02",
    "description": "Informative description of the second subdataset...",
    "license" : "https://creativecommons.org/publicdomain/zero/1.0/"
  }
]
"isPartOf" : "https://example.com/aggregate_dataset"
identifier URL, Text या PropertyValue

एक पहचानकर्ता, जैसे डीओआई या कॉम्पैक्ट पहचानकर्ता. अगर डेटासेट में एक से ज़्यादा पहचानकर्ता हैं, तो identifier प्रॉपर्टी को एक से ज़्यादा बार इस्तेमाल करें. अगर आप JSON-LD का इस्तेमाल कर रहे हैं, तो यह JSON सूची के सिंटैक्स का इस्तेमाल करके दिखाया जाता है.

keywords Text

डेटासेट की खास जानकारी देने वाले कीवर्ड.

license URL, CreativeWork

वह लाइसेंस जिससे डेटासेट उपलब्ध कराया जाता है. उदाहरण के लिए:

"license" : "https://creativecommons.org/publicdomain/zero/1.0/"
"license" : {
  "@type": "CreativeWork",
  "name": "Custom license",
  "url": "https://example.com/custom_license"
  }

अन्य दिशा-निर्देश

  • ऐसा यूआरएल दें जो साफ़ तौर पर, इस्तेमाल किए गए लाइसेंस के खास वर्शन की पहचान करता हो.

    सुझाया गया

    "license" : "https://creativecommons.org/licenses/by/4.0"

    सुझाया नहीं गया

    "license" : "https://creativecommons.org/licenses/by"
sameAs URL

संदर्भ वाले वेब पेज का यूआरएल ,जो साफ़ तौर पर डेटासेट की पहचान बताता है. आम तौर पर यह अलग रेपॉज़िटरी (डेटा स्टोर करने की जगह) में होता है.

spatialCoverage Text, जगह

आप डेटासेट की जगह संबंधी जानकारी एक ही जगह पर मुहैया करा सकते हैं. अगर डेटासेट में जगह की जानकारी दी गई है, तो ही इस प्रॉपर्टी को शामिल करें. जैसे कि, ऐसी एक जगह जहां इकट्ठी की गई माप की सारी जानकारियां या किसी जगह के लिए बाउंडिंग बॉक्स की जगह की जानकारी मौजूद हो.

पॉइंट

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoCoordinates",
    "latitude": 39.3280,
    "longitude": 120.1633
  }
}

आकार

अलग-अलग आकार वाली जगहों के बारे में जानकारी देने के लिए GeoShape का इस्तेमाल करें. जैसे कि बाउंडिंग बॉक्स बताने के लिए.

"spatialCoverage:" {
  "@type": "Place",
  "geo": {
    "@type": "GeoShape",
    "box": "39.3280 120.1633 40.445 123.7878"
  }
}

box, circle, line या polygonप्रॉपर्टी में दिए गए पॉइंट में अक्षांश और देशांतर (इसी क्रम में) के हिसाब से दो मानों के जोड़े को स्पेस से अलग करके दिखाया जाना चाहिए.

जगहों के नाम

"spatialCoverage:" "Tahoe City, CA"
temporalCoverage Text

डेटासेट के डेटा में समय अंतराल की खास जानकारी शामिल होती है. अगर डेटासेट में समय की जानकारी दी गई है, तो ही इस प्रॉपर्टी को शामिल करें. Schema.org में आईएसओ ISO 8601 मानक का इस्तेमाल करके समय अंतरालों और किसी खास समय के बारे में जानकारी दी जाती है. आप डेटासेट में दिए अंतराल के आधार पर, तारीखों के बारे में अलग-अलग तरह से जानकारी दे सकते हैं. समय के दो खुले अंतरालों के बारे में बताने के लिए दो दशमलव बिंदुओं (..) का इस्तेमाल किया जाता है.

कोई एक तारीख

"temporalCoverage" : "2008"

समय अवधि

"temporalCoverage" : "1950-01-01/2013-12-18"

खुली समय अवधि

"temporalCoverage" : "2013-12-19/.."
variableMeasured Text, PropertyValue

ऐसा वैरिएबल जिसे यह डेटासेट मापता है. जैसे कि तापमान या दबाव.

version Text, Number

डेटासेट का वर्शन नंबर.

url URL

डेटासेट के बारे में जानकारी देने वाले पेज की जगह.

DataCatalog

DataCatalog की पूरी जानकारी schema.org/DataCatalog पर मौजूद है.

डेटासेट अक्सर रिपोज़िटरी (डेटा संग्रह की जगह) में प्रकाशित किए जाते हैं. यहां पर कई दूसरे डेटासेट भी मौजूद होते हैं. एक ही डेटासेट को ऐसी एक से ज़्यादा रिपोज़िटरी (डेटा संग्रह की जगह) में शामिल किया जा सकता है. आप सीधे इस डेटासेट की जानकारी देते हुए इसके डेटा कैटलॉग के बारे में बता सकते हैं.

सुझाई गई प्रॉपर्टी
includedInDataCatalog DataCatalog

वह कैटलॉग जिससे यह डेटासेट जुड़ा है.

DataDownload

DataDownload की पूरी जानकारी schema.org/DataDownload पर मौजूद है. डेटासेट की प्रॉपर्टी के अलावा, डेटासेट के लिए नीचे बताई गई वे प्रॉपर्टी जोड़ें जो डाउनलोड के विकल्प मुहैया कराती हैं.

distribution प्रॉपर्टी, डेटासेट पाने की सुविधा मुहैया कराती है. इसमें मौजूद यूआरएल अक्सर डेटासेट की जानकारी देने वाले लैंडिंग पेज पर ले जाता है. distribution प्रॉपर्टी में यह जानकारी दी जाती है कि डेटा कहां से और किस फ़ॉर्मैट में मिलेगा. इस प्रॉपर्टी में कई मान हो सकते हैं: जैसे कि CSV वर्शन एक यूआरएल में मौजूद होता है और Excel वर्शन दूसरे यूआरएल में.

ज़रूरी प्रॉपर्टी
distribution.contentUrl URL

डाउनलोड करने के लिए लिंक.

सुझाई गई प्रॉपर्टी
distribution DataDownload

डेटासेट डाउनलोड करने की जगह और डाउनलोड किए जाने वाले फ़ाइल फ़ॉर्मैट की जानकारी.

distribution.encodingFormat Text, URL

डेटासेट शेयर करने के लिए फ़ाइल फ़ॉर्मैट.

टेबल में रखा गया डेटासेट

टेबल में रखे गए डेटासेट को खास तौर पर रो और कॉलम के ग्रिड में व्यवस्थित किया जाता है. टेबल में रखे गए डेटासेट एम्बेड करने वाले पेजों के लिए, आप ऊपर बताए गए मूल तरीके के हिसाब से ज़्यादा साफ़ जानकारी देने वाला मार्कअप भी बना सकते हैं. फ़िलहाल, हमें CSVW ("वेब पर CSV", W3C देखें) के उस फ़र्क़ की जानकारी है जिसे एचटीएमएल पेज पर टेबल में रखी गई उपयोगकर्ता के काम की सामग्री के साथ ही उपलब्ध कराया जाता है.

यहां ऐसी छोटी सी टेबल का उदाहरण दिया गया है जिसे CSVW JSON-LD फ़ॉर्मैट के कोड में बदला गया है. ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) के टेस्ट में कुछ पहले से जानकारी वाली गड़बड़ियां मिली हैं.

Search Console की मदद से, ज़्यादा बेहतर नतीजों (रिच रिज़ल्ट) पर नज़र रखना

Search Console एक ऐसा टूल है जिसकी मदद से, आप Google Search में अपने पेज की परफ़ॉर्मेंस पर नज़र रख सकते हैं. Google Search के नतीजों में अपनी साइट शामिल कराने लिए, आपको Search Console में साइन अप करने की ज़रूरत नहीं है. हालांकि, इससे आपको यह समझने में मदद मिलेगी कि Google आपकी साइट को कैसे देखता है. साथ ही, इसकी मदद से, आप साइट की परफ़ॉर्मेंस को भी बेहतर बना पाएंगे. हमारा सुझाव है कि आप इन मामलों में Search Console देखें:

  1. पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद
  2. नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद
  3. समय-समय पर ट्रैफ़िक का विश्लेषण करना

पहली बार स्ट्रक्चर्ड डेटा इस्तेमाल करने के बाद

जब Google, आपके पेजों को इंडेक्स कर ले, तब ज़्यादा बेहतर नतीजे (रिच रिज़ल्ट) की स्थिति रिपोर्ट का इस्तेमाल करके, उन गड़बड़ियों को देखें जिन्हें ठीक करने की ज़रूरत है. आपको सही पेजों की संख्या में बढ़ोतरी दिखेगी और गड़बड़ियों या चेतावनियों में कोई बढ़ोतरी नहीं दिखेगी. अगर आपको स्ट्रक्चर्ड डेटा में गड़बड़ियां मिलती हैं, तो:

  1. गड़बड़ियां ठीक करें.
  2. लाइव यूआरएल की जांच करें और देखें कि गड़बड़ी ठीक हुई या नहीं.
  3. स्थिति रिपोर्ट का इस्तेमाल करके, पुष्टि करने का अनुरोध करें.

नए टेंप्लेट जारी करने या कोड को अपडेट करने के बाद

जब आप वेबसाइट में, कई या ज़रूरी बदलाव करते हैं, तब स्ट्रक्चर्ड डेटा की गड़बड़ियों और चेतावनियों में हुई बढ़ोतरी पर नज़र रखें.
  • अगर आपको गड़बड़ियों में बढ़ोतरी, दिखती है, तो हो सकता है कि आपने ऐसा नया टेंप्लेट जारी किया हो जो काम नहीं करता. इसके अलावा, यह भी हो सकता है कि आपकी साइट, मौजूदा टेंप्लेट से नए और खराब तरीके से इंटरैक्ट कर रही हो.
  • अगर आपको मान्य आइटम की संख्या में कमी दिखती है यानी वह गड़बड़ियों में बढ़ोतरी से मेल नहीं खाती, तो हो सकता है कि अब आप पेजों में स्ट्रक्चर्ड डेटा एम्बेड नहीं कर रहे हैं. गड़बड़ी की वजह जानने के लिए, यूआरएल जांचने वाले टूल का इस्तेमाल करें.

समय-समय पर ट्रैफ़िक का विश्लेषण करना

परफ़ॉर्मेंस रिपोर्ट का इस्तेमाल करके, Google Search से आने वाले ट्रैफ़िक का विश्लेषण करें. आपको डेटा से पता चलेगा कि आपका पेज Search में, रिच रिज़ल्ट के तौर पर कितनी बार दिखता है. साथ ही, यह भी पता चलेगा कि उयोगकर्ता उस पर कितनी बार क्लिक करते हैं और खोज के नतीजों में आपकी साइट के दिखने की औसत रैंक क्या है. आप इन नतीजों को Search Console API की मदद से, अपने-आप भी देख सकते हैं.

समस्या का हल

अगर आपको स्ट्रक्चर्ड डेटा का इस्तेमाल करने में कोई परेशानी आ रही है, तो ये रिसॉर्स आपकी मदद कर सकते हैं.