इस दस्तावेज़ में, डेटासेट के साथ काम करने के लिए ज़रूरी शर्तों, सबसे सही तरीकों, और आम तौर पर होने वाली गड़बड़ियों के बारे में बताया गया है.
ज़रूरी शर्तें
डेटासेट बनाते समय:
- आपके Google Cloud प्रोजेक्ट में, डिसप्ले नेम यूनीक होने चाहिए.
- डिसप्ले नेम में 64 से कम बाइट होने चाहिए. ऐसा इसलिए है, क्योंकि इन वर्णों को UTF-8 में दिखाया जाता है. कुछ भाषाओं में, हर वर्ण को कई बाइट में दिखाया जा सकता है.
- जानकारी 1,000 बाइट से कम होनी चाहिए.
डेटा अपलोड करते समय:
- CSV, GeoJSON, और KML फ़ाइल टाइप का इस्तेमाल किया जा सकता है.
- फ़ाइल का साइज़ 500 एमबी से ज़्यादा नहीं होना चाहिए.
- एट्रिब्यूट कॉलम के नाम, "?_" स्ट्रिंग से शुरू नहीं हो सकते.
- तीन डाइमेंशन वाली ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स और GeoJSON फ़ॉर्मैट में ऊंचाई का कोऑर्डिनेट शामिल है.
डेटा तैयार करने के सबसे सही तरीके
अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि घने पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (आम तौर पर, 50 एमबी से बड़ी सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में सबसे अच्छी परफ़ॉर्मेंस पाने के लिए, अपलोड करने से पहले अपने डेटा को आसान बनाएं.
डेटा तैयार करने के लिए, यहां कुछ सबसे सही तरीके दिए गए हैं:
- सुविधा की प्रॉपर्टी को कम से कम करें. अपने मैप को स्टाइल देने के लिए, सिर्फ़ ज़रूरी सुविधा प्रॉपर्टी रखें. उदाहरण के लिए, "आईडी" और "कैटगरी". किसी यूनीक आइडेंटिफ़ायर कुंजी पर डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, क्लाइंट ऐप्लिकेशन में किसी सुविधा में अतिरिक्त प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, देखें कि डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा कैसे देखा जा सकता है.
- टाइल के साइज़ को कम करने और मैप की परफ़ॉर्मेंस को बेहतर बनाने के लिए, जहां भी हो सके वहां प्रॉपर्टी ऑब्जेक्ट के लिए साधारण डेटा टाइप का इस्तेमाल करें. जैसे, पूर्णांक.
- फ़ाइल अपलोड करने से पहले, जटिल ज्यामिति को आसान बनाएं. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स Mapshaper.org की सुविधा या BigQuery में, जटिल पॉलीगॉन ज्यामिति पर ST_Simplify का इस्तेमाल करना.
- फ़ाइल अपलोड करने से पहले, बहुत ज़्यादा पॉइंट को क्लस्टर करें. ऐसा करने के लिए, अपनी पसंद के किसी भी भू-स्थानिक टूल का इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स turf.js क्लस्टर फ़ंक्शन या BigQuery में, घने पॉइंट ज्यामिति पर ST_CLUSTERDBSCAN का इस्तेमाल करना.
डेटासेट और BigQuery की मदद से अपना डेटा विज़ुअलाइज़ करना लेख में, डेटासेट के सबसे सही तरीकों के बारे में ज़्यादा जानकारी देखें.
GeoJSON की ज़रूरी शर्तें
Maps डेटासेट एपीआई, मौजूदा GeoJSON स्पेसिफ़िकेशन के साथ काम करता है. Maps डेटासेट एपीआई, GeoJSON फ़ाइलों के साथ भी काम करता है. इन फ़ाइलों में, इनमें से कोई भी ऑब्जेक्ट टाइप शामिल हो सकता है:
- ज्यामिति ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, जगह के हिसाब से बना आकार होता है. इसे पॉइंट, लाइनों, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें होल भी हो सकते हैं.
- सुविधा ऑब्जेक्ट. किसी फ़ीचर ऑब्जेक्ट में ज्यामिति के साथ-साथ, नाम/वैल्यू के अतिरिक्त जोड़े भी होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग होता है.
- सुविधा वाले कलेक्शन. फ़ीचर कलेक्शन, फ़ीचर ऑब्जेक्ट का एक सेट होता है.
Maps डेटासेट API, ऐसी GeoJSON फ़ाइलों के साथ काम नहीं करता जिनमें WGS84 के अलावा किसी दूसरे कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा हो.
GeoJSON के बारे में ज़्यादा जानकारी के लिए, आरएफ़सी 7946 के मुताबिक देखें.
KML की ज़रूरी शर्तें
Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:
- सभी यूआरएल, फ़ाइल के लिए लोकल (या रिलेटिव) होने चाहिए.
- पॉइंट, लाइन, और पॉलीगॉन ज्यामिति काम करती है.
- सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.
- फ़ाइल के बाहर तय किए गए आइकॉन या
<styleUrl>
. - नेटवर्क लिंक, जैसे कि
<NetworkLink>
- ग्राउंड ओवरले, जैसे कि
<GroundOverlay>
- 3D ज्यामिति या ऊंचाई से जुड़े टैग, जैसे कि
<altitudeMode>
- कैमरे की जानकारी, जैसे कि
<LookAt>
- KML फ़ाइल में तय की गई स्टाइल.
CSV फ़ाइल से जुड़ी ज़रूरी शर्तें
CSV फ़ाइलों के लिए, काम करने वाले कॉलम के नाम प्राथमिकता के क्रम में यहां दिए गए हैं:
latitude
,longitude
lat
,long
x
,y
wkt
(Well-Known Text)address
,city
,state
,zip
address
- एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
उदाहरण के लिए, आपकी फ़ाइल में x
, y
, और wkt
नाम के कॉलम हैं.
ऊपर दी गई सूची में, इस्तेमाल किए जा सकने वाले कॉलम के नामों के क्रम से यह तय किया जाता है कि x
और y
की प्राथमिकता ज़्यादा है. इसलिए, x
और y
कॉलम की वैल्यू का इस्तेमाल किया जाता है और wkt
कॉलम को अनदेखा कर दिया जाता है.
इसके अलावा:
- हर कॉलम का नाम, किसी एक कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास
xy
नाम का ऐसा कॉलम नहीं हो सकता जिसमें x और y, दोनों निर्देशांक का डेटा हो. x और y निर्देशांक, अलग-अलग कॉलम में होने चाहिए. - कॉलम के नाम केस-इनसेंसिटिव होते हैं.
- कॉलम के नामों के क्रम से कोई फ़र्क़ नहीं पड़ता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में
lat
औरlong
कॉलम हैं, तो वे किसी भी क्रम में हो सकते हैं.
डेटा अपलोड करने से जुड़ी गड़बड़ियां ठीक करना
किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी दिख सकती है.
GeoJSON से जुड़ी गड़बड़ियां
GeoJSON से जुड़ी आम गड़बड़ियां:
type
फ़ील्ड मौजूद नहीं है याtype
कोई स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, हर फ़ीचर ऑब्जेक्ट और ज्यामिति ऑब्जेक्ट की परिभाषा के हिस्से के तौर पर,type
नाम का स्ट्रिंग फ़ील्ड होना चाहिए.
KML से जुड़ी गड़बड़ियां
KML फ़ाइल में होने वाली आम गड़बड़ियां:
- डेटा फ़ाइल में, ऊपर दी गई ऐसी कोई भी KML सुविधा शामिल नहीं होनी चाहिए जो काम नहीं करती. ऐसा होने पर, डेटा इंपोर्ट नहीं हो पाएगा.
CSV फ़ाइल से जुड़ी गड़बड़ियां
CSV फ़ाइल में ये आम गड़बड़ियां होती हैं:
- कुछ पंक्तियों में ज्यामिति कॉलम की वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी पंक्तियों में, ज्यामिति कॉलम के लिए ऐसी वैल्यू होनी चाहिए जो खाली न हों. ज्यामिति कॉलम में ये शामिल हैं:
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
,zip
address
- एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
- अगर
x
औरy
आपके ज्यामिति कॉलम हैं, तो पक्का करें कि इकाइयां, देशान्तर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, हेडर के तहत अलग-अलग निर्देशांक सिस्टम का इस्तेमाल करते हैंx
औरy
. अगर गलत यूनिट का इस्तेमाल किया जाता है, तो हो सकता है कि डेटासेट ठीक से इंपोर्ट हो जाए, लेकिन रेंडर किए गए डेटा में डेटासेट पॉइंट अनचाही जगहों पर दिखें.