डेटा टाइप और सिमैंटिक टाइप

कम्यूनिटी कनेक्टर बनाते समय, स्कीमा में बताई गई हर फ़ील्ड के लिए डेटा टाइप की ज़रूरत होती है. डेटा टाइप, फ़ील्ड के प्रिमिटिव टाइप के बारे में बताता है, जैसे कि BOOLEAN, STRING, NUMBER वगैरह.

डेटा टाइप के अलावा, Looker Studio सिमैंटिक टाइप का भी इस्तेमाल करता है. सिमैंटिक टाइप से यह बताने में मदद मिलती है कि डेटा किस तरह की जानकारी देता है. उदाहरण के लिए, NUMBER डेटा टाइप वाला फ़ील्ड, शब्द के हिसाब से मुद्रा की रकम या प्रतिशत दिखा सकता है. STRING डेटा टाइप वाला फ़ील्ड, शब्द के हिसाब से शहर को दिखा सकता है. यह जानने के लिए कि किस तरह के सिमैंटिक उपलब्ध हैं, कृपया सेमैंटिक टाइप के दस्तावेज़ देखें

कम्यूनिटी कनेक्टर स्कीमा और Looker Studio के फ़ील्ड

अपने कम्यूनिटी कनेक्टर के लिए स्कीमा तय करने पर, हर फ़ील्ड में कई प्रॉपर्टी होती हैं. इनसे यह तय होता है कि Looker Studio में फ़ील्ड को कैसे दिखाया और इस्तेमाल किया जाएगा. उदाहरण के लिए:

  • conceptType को आपके कनेक्टर स्कीमा में conceptType प्रॉपर्टी का इस्तेमाल करके तय किया जाता है. इस प्रॉपर्टी से यह तय होता है कि फ़ील्ड को डाइमेंशन माना जाएगा या मेट्रिक. मेट्रिक और डाइमेंशन के बीच अंतर की जानकारी डाइमेंशन और मेट्रिक पर मिल सकती है.
  • सिमेंटिक टाइप को कनेक्टर स्कीमा में तय किया जा सकता है या Looker Studio से इसकी पहचान अपने-आप की जा सकती है. Looker Studio, आपके कनेक्टर में बताई गई डेटा टाइप प्रॉपर्टी और कनेक्टर से मिली डेटा वैल्यू के आधार पर ऐसा करता है. यह सुविधा कैसे काम करती है, इस बारे में जानने के लिए अपने-आप सिमैंटिक टाइप की पहचान करना देखें.
  • एग्रीगेशन टाइप से यह तय होता है कि मेट्रिक वैल्यू (डाइमेंशन को अनदेखा किया जाता है) को फिर से एग्रीगेट किया जा सकता है या नहीं. semantics.isReaggregatable प्रॉपर्टी को true पर सेट करने पर, यह डिफ़ॉल्ट रूप से SUM एग्रीगेशन पर सेट हो जाएगी. ऐसा न होने पर, यह Auto पर सेट होती है. defaultAggregationType प्रॉपर्टी का इस्तेमाल करके, रीएग्रीगेट किए जा सकने वाले फ़ील्ड के लिए, डिफ़ॉल्ट एग्रीगेशन टाइप को मैन्युअल तरीके से भी सेट किया जा सकता है.

Looker Studio में कनेक्टर का इस्तेमाल करके कॉन्फ़िगर और कनेक्ट करने पर, फ़ील्ड एडिटर, कनेक्टर के लिए पूरा स्कीमा दिखाता है. यह स्कीमा, ऊपर दी गई प्रॉपर्टी के आधार पर दिखाया जाता है. अगर आपने सिमैंटिक टाइप शामिल किए हैं, तो वे उसी तरह दिखेंगे जैसे आपने उन्हें तय किया था. अगर अपने-आप सिमैंटिक टाइप की पहचान करने की सुविधा का इस्तेमाल किया जा रहा है, तो फ़ील्ड का पता चलते ही वे दिखेंगे. फ़ील्ड स्क्रीन

सिमैंटिक जानकारी सेट करना

सिमैंटिक जानकारी सेट करने के दो तरीके हैं. फ़ील्ड के सिमैंटिक को मैन्युअल तरीके से सेट किया जा सकता है या Looker Studio की मदद से, इसका अपने-आप पता लगाया जा सकता है.

उदाहरण के लिए, अगर आपके पास कोई ऐसी संख्या है जो सिमैंटिक के हिसाब से डॉलर को दिखाती है, तो Looker Studio इस सिमैंटिक टाइप की अपने-आप पहचान नहीं कर पाएगा. इसके अलावा, अपने-आप सिमैंटिक की पहचान करने के लिए ज़रूरी है कि Looker Studio आपके स्कीमा के हर फ़ील्ड के लिए डेटा फ़ेच करे. इसके बजाय, अगर मैन्युअल तरीके से स्कीमा बताया जाता है, तो डेटा फ़ेच करने की सुविधा वाला कोई कॉल नहीं किया जाएगा. अगर आपको अपने डेटा का सिमैंटिक टाइप (जैसे कि मुद्रा, प्रतिशत, तारीख वगैरह) पता है, तो हमारा सुझाव है कि इसे स्कीमा में साफ़ तौर पर सेट करें. इससे, डेटा के सटीक होने और परफ़ॉर्मेंस की वजहों को जानने में मदद मिलेगी.

सिमैंटिक टाइप को मैन्युअल तरीके से सेट करना (सुझाया गया)

अगर आपको अपने सिमैंटिक टाइप पता हैं, तो हर स्कीमा फ़ील्ड के लिए मैन्युअल तरीके से semantics तय करें. आपके लिए उपलब्ध प्रॉपर्टी की पूरी जानकारी फ़ील्ड रेफ़रंस पेज पर देखा जा सकता है. अगर आपने मैन्युअल सिमैंटिक टाइप तय करने का विकल्प चुना है, तो हमारा सुझाव है कि आप हर फ़ील्ड के लिए semanticType और semanticGroup तय करें. मैन्युअल तरीके से ये प्रॉपर्टी देने पर, सिमैंटिक टाइप की अपने-आप पहचान करने की प्रोसेस नहीं चलेगी. अगर आपने सभी के बजाय, मैन्युअल तरीके से कुछ फ़ील्ड सेट किए हैं, तो वे फ़ील्ड जिनके लिए आपने डिफ़ॉल्ट तौर पर Text, Number या Boolean नहीं बताया है यह फ़ील्ड के लिए तय किए गए dataType के आधार पर तय होता है.

नीचे एक आसान स्कीमा का उदाहरण दिया गया है, जो सिमैंटिक टाइप को मैन्युअल तरीके से सेट करता है. Income को मुद्रा के तौर पर और Filing Year को तारीख के तौर पर सेट किया गया है.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

मैन्युअल सिमैंटिक टाइप से जुड़ी समस्याओं को हल करना

अगर दिए गए डेटा के लिए सिमैंटिक टाइप गलत सेट किए जाते हैं, तो वे ठीक से काम नहीं करेंगे. इसकी जांच करना मुश्किल हो सकता है, लेकिन समस्याओं का पता लगाने के लिए कुछ तरीके अपनाए जा सकते हैं.

  1. अपने पूरे डेटा की बजाय दो या तीन पंक्तियां दें और मैन्युअल रूप से उसकी जांच करें.
  2. Looker Studio में एक ऐसी टेबल बनाएं जिसमें सिर्फ़ उस फ़ील्ड का इस्तेमाल होता हो जिसे आपको देखना है.
  3. Geo और Date फ़ील्ड पर ध्यान दें, क्योंकि ये फ़ील्ड सबसे सख्त होते हैं.

सिमैंटिक टाइप की अपने-आप पहचान करने की सुविधा

अगर आपने अपने स्कीमा में किसी सिमैंटिक टाइप को तय नहीं किया है, तो Looker Studio डेटा टाइप प्रॉपर्टी और आपके कनेक्टर से मिली डेटा वैल्यू के फ़ॉर्मैट के आधार पर, उन्हें अपने-आप पहचानने की कोशिश करेगा.

अपने-आप पता लगाने की प्रोसेस के चरण इस तरह हैं:

  1. अपने कम्यूनिटी कनेक्टर के getSchema फ़ंक्शन को चलाकर स्कीमा का अनुरोध करें.
  2. कनेक्टर स्कीमा में तय किए गए फ़ील्ड के बैच के ज़रिए दोहराना और समस्या getData फ़ील्ड के लिए अनुरोध करती है. getData अनुरोधों को true पर सेट sampleExtraction पैरामीटर के साथ लागू किया जाता है. इससे यह पता चलता है कि डेटा के अनुरोध, सिमैंटिक डिटेक्शन के लिए किए गए हैं.
  3. फ़ील्ड डेटा टाइप और getData अनुरोध से मिलने वाले वैल्यू के फ़ॉर्मैट के आधार पर, फ़ील्ड के सिमैंटिक टाइप की पहचान करें.

अपने-आप सिमैंटिक टाइप की पहचान करने की सुविधा को मैनेज करने के विकल्प

जब Looker Studio सिमैंटिक डिटेक्शन के लिए, किसी कम्यूनिटी कनेक्टर के getData फ़ंक्शन को एक्ज़ीक्यूट करता है, तो मिलने वाले अनुरोध में एक sampleExtraction प्रॉपर्टी होगी, जिसे true पर सेट किया जाएगा. Looker Studio, आपके कनेक्टर से मिले डेटा का इस्तेमाल सिर्फ़ फ़ील्ड के सिमैंटिक की पहचान करने के लिए करता है. वैल्यू का इस्तेमाल किसी और काम के लिए नहीं किया जाएगा, इसलिए इसे आपके बाहरी सोर्स के असल डेटा की ज़रूरत नहीं होती.

अपने कोड में सिमैंटिक टाइप की पहचान को बेहतर बनाने के कई तरीके हैं:

  • इसका सुझाव दिया जाता है: पहले से तय की गई वैल्यू पास करें
    हर उस फ़ील्ड के लिए पहले से तय की गई वैल्यू दिखाएं जो फ़ील्ड के सिमैंटिक टाइप को सबसे सही तरीके से दिखाती हो. साथ ही, यह भी हो सकता है कि Looker Studio उसकी पहचान सही तरीके से करे. उदाहरण के लिए, अगर किसी फ़ील्ड का सिमैंटिक टाइप Country है, तो इटली के लिए IT जैसा वैल्यू दिखाएं. इस तरीके का दूसरा फ़ायदा यह है कि यह बहुत तेज़ी से काम करता है, क्योंकि इसमें आपको डेटा के लिए तीसरे पक्ष की सेवा को एचटीटीपी अनुरोध करने की ज़रूरत नहीं होती.

  • सिर्फ़ n रिकॉर्ड दिखाएं
    अगर तीसरे पक्ष की जिस सेवा से डेटा फ़ेच किया जा रहा है उसके लिए, डेटा का अनुरोध करते समय लाइन की सीमाओं की सुविधा काम करती है, तो पूरे डेटा सेट के बजाय Looker Studio को लाइन का एक छोटा सबसेट दिखाएं. इससे, सिमैंटिक की पहचान करने के हर अनुरोध के लिए, Looker Studio को पास किया जाने वाला डेटा सीमित हो जाएगा.

  • सभी कॉलम के लिए अनुरोध करें और जवाब को कैश मेमोरी में सेव करें
    अगर तीसरे पक्ष की उस सेवा के लिए सभी कॉलम का अनुरोध किया जा सकता है जिससे डेटा फ़ेच किया जा रहा है, तो Looker Studio से मिले सिमैंटिक डिटेक्शन के पहले अनुरोध पर, सभी कॉलम फ़ेच किए जाएंगे और नतीजों को कैश मेमोरी में सेव किया जाएगा. बाद में आने वाले सिमैंटिक डिटेक्शन के अनुरोधों के लिए, तीसरे पक्ष की सेवा को अतिरिक्त एचटीटीपी अनुरोध करने के बजाय, कैश मेमोरी से कॉलम की वैल्यू फ़ेच की जाती है.

  • कुछ अलग न करें
    आपके पास उन अनुरोधों के लिए किसी खास तरीके से बदलाव लागू करने का विकल्प नहीं होता जहां sampleExtraction को true पर सेट किया गया हो. इस वजह से, सिमैंटिक डिटेक्शन की प्रोसेस धीमी हो जाएगी, क्योंकि Looker Studio को सेमैंटिक डिटेक्शन प्रोसेस के लिए, पूरा डेटा फ़ेच करना होगा. इसके अलावा, इससे आपके बाहरी डेटा सोर्स के लिए किए गए अनुरोध की दर पर असर पड़ेगा, क्योंकि सिमेंटिक डिटेक्शन के कई अनुरोध साथ-साथ लागू किए जाते हैं.

अपने-आप सिमैंटिक टाइप की पहचान करने के लिए पहचाने गए फ़ॉर्मैट

तारीख और समय
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • समय: सेकंड, माइक्रो, मिली, और नैनो के लिए epoch.
भौगोलिक