आरंभ करने से पहले

इस दस्तावेज़ में, डेटासेट के साथ काम करने के लिए ज़रूरी शर्तों, सबसे सही तरीकों, और आम तौर पर होने वाली गड़बड़ियों के बारे में बताया गया है.

ज़रूरी शर्तें

डेटासेट बनाते समय:

  • आपके Google Cloud प्रोजेक्ट में, डिसप्ले नेम यूनीक होने चाहिए.
  • डिसप्ले नेम में 64 से कम बाइट होने चाहिए. ऐसा इसलिए है, क्योंकि इन वर्णों को UTF-8 में दिखाया जाता है. कुछ भाषाओं में, हर वर्ण को कई बाइट में दिखाया जा सकता है.
  • जानकारी 1,000 बाइट से कम होनी चाहिए.

डेटा अपलोड करते समय:

  • CSV, GeoJSON, और KML फ़ाइल टाइप का इस्तेमाल किया जा सकता है.
  • फ़ाइल का साइज़ 500 एमबी से ज़्यादा नहीं होना चाहिए.
  • एट्रिब्यूट कॉलम के नाम, "?_" स्ट्रिंग से शुरू नहीं हो सकते.
  • तीन डाइमेंशन वाली ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स और GeoJSON फ़ॉर्मैट में ऊंचाई का कोऑर्डिनेट शामिल है.

डेटा तैयार करने के सबसे सही तरीके

अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि घने पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (आम तौर पर, 50 एमबी से बड़ी सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में सबसे अच्छी परफ़ॉर्मेंस पाने के लिए, अपलोड करने से पहले अपने डेटा को आसान बनाएं.

डेटा तैयार करने के लिए, यहां कुछ सबसे सही तरीके दिए गए हैं:

  1. सुविधा की प्रॉपर्टी को कम से कम करें. अपने मैप को स्टाइल देने के लिए, सिर्फ़ ज़रूरी सुविधा प्रॉपर्टी रखें. उदाहरण के लिए, "आईडी" और "कैटगरी". किसी यूनीक आइडेंटिफ़ायर कुंजी पर डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, क्लाइंट ऐप्लिकेशन में किसी सुविधा में अतिरिक्त प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, देखें कि डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा कैसे देखा जा सकता है.
  2. टाइल के साइज़ को कम करने और मैप की परफ़ॉर्मेंस को बेहतर बनाने के लिए, जहां भी हो सके वहां प्रॉपर्टी ऑब्जेक्ट के लिए साधारण डेटा टाइप का इस्तेमाल करें. जैसे, पूर्णांक.
  3. फ़ाइल अपलोड करने से पहले, जटिल ज्यामिति को आसान बनाएं. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स Mapshaper.org की सुविधा या BigQuery में, जटिल पॉलीगॉन ज्यामिति पर ST_Simplify का इस्तेमाल करना.
  4. फ़ाइल अपलोड करने से पहले, बहुत ज़्यादा पॉइंट को क्लस्टर करें. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स turf.js क्लस्टर फ़ंक्शन या BigQuery में, घने पॉइंट ज्यामिति पर ST_CLUSTERDBSCAN का इस्तेमाल करना.

डेटासेट और BigQuery की मदद से अपना डेटा विज़ुअलाइज़ करना लेख में, डेटासेट के सबसे सही तरीकों के बारे में ज़्यादा जानकारी देखें.

GeoJSON की ज़रूरी शर्तें

Maps डेटासेट एपीआई, मौजूदा GeoJSON स्पेसिफ़िकेशन के साथ काम करता है. Maps डेटासेट एपीआई, GeoJSON फ़ाइलों के साथ भी काम करता है. इन फ़ाइलों में, इनमें से कोई भी ऑब्जेक्ट टाइप शामिल हो सकता है:

  • ज्यामिति ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, जगह के हिसाब से बना आकार होता है. इसे पॉइंट, लाइनों, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें होल भी हो सकते हैं.
  • सुविधा ऑब्जेक्ट. किसी फ़ीचर ऑब्जेक्ट में ज्यामिति के साथ-साथ, नाम/वैल्यू के अतिरिक्त जोड़े भी होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग होता है.
  • सुविधा वाले कलेक्शन. फ़ीचर कलेक्शन, फ़ीचर ऑब्जेक्ट का एक सेट होता है.

Maps डेटासेट API, ऐसी GeoJSON फ़ाइलों के साथ काम नहीं करता जिनमें WGS84 के अलावा किसी दूसरे कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा हो.

GeoJSON के बारे में ज़्यादा जानकारी के लिए, आरएफ़सी 7946 के मुताबिक देखें.

KML की ज़रूरी शर्तें

Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:

  • सभी यूआरएल, फ़ाइल के लिए लोकल (या रिलेटिव) होने चाहिए.
  • पॉइंट, लाइन, और पॉलीगॉन ज्यामिति काम करती है.
  • सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.
KML की ये सुविधाएं काम नहीं करतीं:
  • फ़ाइल के बाहर तय किए गए आइकॉन या <styleUrl>.
  • नेटवर्क लिंक, जैसे कि <NetworkLink>
  • ग्राउंड ओवरले, जैसे कि <GroundOverlay>
  • 3D ज्यामिति या ऊंचाई से जुड़े टैग, जैसे कि <altitudeMode>
  • कैमरे की जानकारी, जैसे कि <LookAt>
  • KML फ़ाइल में तय की गई स्टाइल.

CSV फ़ाइल से जुड़ी ज़रूरी शर्तें

CSV फ़ाइलों के लिए, काम करने वाले कॉलम के नाम प्राथमिकता के क्रम में यहां दिए गए हैं:

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (Well-Known Text)
  • address, city, state, zip
  • address
  • एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि 1600 Amphitheatre Parkway Mountain View, CA 94043

उदाहरण के लिए, आपकी फ़ाइल में x, y, और wkt नाम के कॉलम हैं. ऊपर दी गई सूची में, इस्तेमाल किए जा सकने वाले कॉलम के नामों के क्रम से यह तय किया जाता है कि x और y की प्राथमिकता ज़्यादा है. इसलिए, x और y कॉलम की वैल्यू का इस्तेमाल किया जाता है और wkt कॉलम को अनदेखा कर दिया जाता है.

इसके अलावा:

  • हर कॉलम का नाम, किसी एक कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास xy नाम का ऐसा कॉलम नहीं हो सकता जिसमें x और y, दोनों निर्देशांक का डेटा हो. x और y निर्देशांक, अलग-अलग कॉलम में होने चाहिए.
  • कॉलम के नाम केस-इनसेंसिटिव होते हैं.
  • कॉलम के नामों के क्रम से कोई फ़र्क़ नहीं पड़ता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में lat और long कॉलम हैं, तो वे किसी भी क्रम में हो सकते हैं.

डेटा अपलोड करने से जुड़ी गड़बड़ियां ठीक करना

किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी दिख सकती है.

GeoJSON से जुड़ी गड़बड़ियां

GeoJSON से जुड़ी आम गड़बड़ियां:

  • type फ़ील्ड मौजूद नहीं है या type कोई स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, हर फ़ीचर ऑब्जेक्ट और ज्यामिति ऑब्जेक्ट की परिभाषा के हिस्से के तौर पर, type नाम का स्ट्रिंग फ़ील्ड होना चाहिए.

KML से जुड़ी गड़बड़ियां

KML फ़ाइल में होने वाली आम गड़बड़ियां:

  • डेटा फ़ाइल में, ऊपर दी गई ऐसी कोई भी KML सुविधा शामिल नहीं होनी चाहिए जो काम नहीं करती. ऐसा होने पर, डेटा इंपोर्ट नहीं हो पाएगा.

CSV फ़ाइल से जुड़ी गड़बड़ियां

CSV फ़ाइल में ये आम गड़बड़ियां होती हैं:

  • कुछ पंक्तियों में ज्यामिति कॉलम की वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी पंक्तियों में, ज्यामिति कॉलम के लिए ऐसी वैल्यू होनी चाहिए जो खाली न हों. ज्यामिति कॉलम में ये शामिल हैं:
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state, zip
    • address
    • एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि 1600 Amphitheatre Parkway Mountain View, CA 94043
  • अगर x और y आपके ज्यामिति कॉलम हैं, तो पक्का करें कि इकाइयां, देशान्तर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, हेडर के तहत अलग-अलग निर्देशांक सिस्टम का इस्तेमाल करते हैं x और y. अगर गलत यूनिट का इस्तेमाल किया जाता है, तो हो सकता है कि डेटासेट ठीक से इंपोर्ट हो जाए, लेकिन रेंडर किए गए डेटा में डेटासेट पॉइंट अनचाही जगहों पर दिखें.