इस दस्तावेज़ में, डेटासेट के साथ काम करने से जुड़ी ज़रूरी शर्तों, सबसे सही तरीकों, और आम गलतियों के बारे में बताया गया है.
ज़रूरी शर्तें
डेटासेट बनाते समय:
- आपके Google Cloud प्रोजेक्ट के डिसप्ले नेम यूनीक होने चाहिए.
- डिसप्ले नेम 64 बाइट से कम होने चाहिए. ऐसा इसलिए है, क्योंकि इन वर्णों को UTF-8 में दिखाया जाता है. कुछ भाषाओं में, हर वर्ण को कई बाइट में दिखाया जा सकता है.
- ब्यौरे 1,000 बाइट से कम होने चाहिए.
डेटा अपलोड करते समय:
- CSV, GeoJSON, और KML फ़ाइल फ़ॉर्मैट का इस्तेमाल किया जा सकता है.
- ज़्यादा से ज़्यादा 500 एमबी की फ़ाइल ही अपलोड की जा सकती है.
- विशेषता कॉलम के नाम स्ट्रिंग "?_" से शुरू नहीं हो सकते.
- तीन डाइमेंशन वाली ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स और GeoJSON फ़ॉर्मैट में ऐल्टिट्यूड कोऑर्डिनेट शामिल है.
डेटा तैयार करने के सबसे सही तरीके
अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि घने पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (आम तौर पर, 50 एमबी से बड़ी सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में सबसे अच्छी परफ़ॉर्मेंस पाने के लिए, अपलोड करने से पहले अपने डेटा को आसान बनाएं.
डेटा तैयार करने के कुछ सबसे सही तरीके यहां दिए गए हैं:
- सुविधा की प्रॉपर्टी कम करें. अपने मैप को स्टाइल देने के लिए, सिर्फ़ ज़रूरी फ़ीचर प्रॉपर्टी रखें. उदाहरण के लिए, "आईडी" और "कैटगरी". यूनीक आइडेंटिफ़ायर कुंजी पर डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, क्लाइंट ऐप्लिकेशन में किसी सुविधा में अन्य प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, देखें कि डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा कैसे देखा जा सकता है.
- टाइल के साइज़ को कम करने और मैप की परफ़ॉर्मेंस को बेहतर बनाने के लिए, जहां भी हो सके वहां प्रॉपर्टी ऑब्जेक्ट के लिए साधारण डेटा टाइप का इस्तेमाल करें. जैसे, पूर्णांक.
- फ़ाइल अपलोड करने से पहले जटिल ज्यामितियां आसान बनाएं. इसके लिए, अपनी पसंद के जियोस्पेशियल टूल का इस्तेमाल किया जा सकता है. उदाहरण के लिए, ओपन सोर्स Mapshaper.org सुविधा. इसके अलावा, BigQuery में कॉम्प्लेक्स पॉलीगॉन ज्यामितियों के लिए ST_Simplify का इस्तेमाल किया जा सकता है.
- फ़ाइल अपलोड करने से पहले, बहुत ज़्यादा पॉइंट को क्लस्टर करें. ऐसा करने के लिए, अपनी पसंद के जियोस्पेशियल टूल का इस्तेमाल करें. जैसे, ओपन सोर्स के turf.js क्लस्टर फ़ंक्शन या BigQuery में, सघन बिंदु वाली ज्यामितियों पर ST_CLUSTERDBSCAN का इस्तेमाल करें.
डेटासेट और BigQuery की मदद से अपने डेटा को विज़ुअलाइज़ करना में, डेटासेट को इस्तेमाल करने के सबसे सही तरीकों के बारे में ज़्यादा जानकारी देखें.
GeoJSON से जुड़ी ज़रूरी शर्तें
Maps Datasets API मौजूदा GeoJSON खास जानकारी के साथ काम करता है. Maps Datasets API, ऐसी GeoJSON फ़ाइलों के साथ काम करता है जिनमें इनमें से किसी भी तरह का ऑब्जेक्ट होता है:
- ज्यामिति ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, जगह के हिसाब से बना आकार होता है. इसे पॉइंट, लाइनों, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें होल भी हो सकते हैं.
- फ़ीचर ऑब्जेक्ट. किसी फ़ीचर ऑब्जेक्ट में ज्यामिति के साथ-साथ, नाम/वैल्यू के अतिरिक्त जोड़े भी होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग होता है.
- कलेक्शन दिखाएं. सुविधा संग्रह, फ़ीचर ऑब्जेक्ट का एक सेट होता है.
Maps डेटासेट API, ऐसी GeoJSON फ़ाइलों के साथ काम नहीं करता जिनमें WGS84 के अलावा किसी दूसरे कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा हो.
GeoJSON के बारे में ज़्यादा जानकारी के लिए, आरएफ़सी 7946 के मुताबिक देखें.
KML की ज़रूरी शर्तें
Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:
- सभी यूआरएल, फ़ाइल के लिए लोकल (या रिलेटिव) होने चाहिए.
- पॉइंट, लाइन, और पॉलीगॉन ज्यामिति काम करती है.
- सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.
- फ़ाइल के बाहर तय किए गए आइकॉन या
<styleUrl>
. - नेटवर्क लिंक, जैसे कि
<NetworkLink>
- ग्राउंड ओवरले, जैसे कि
<GroundOverlay>
- 3D ज्यामितियां या ऊंचाई से संबंधित कोई भी टैग, जैसे कि
<altitudeMode>
- कैमरे की खास जानकारी, जैसे कि
<LookAt>
- KML फ़ाइल में तय की गई स्टाइल.
CSV फ़ाइल की ज़रूरी शर्तें
CSV फ़ाइलों के लिए, काम करने वाले कॉलम के नाम प्राथमिकता के क्रम में यहां दिए गए हैं:
latitude
,longitude
lat
,long
x
,y
wkt
(जाने-पहचाने टेक्स्ट)address
,city
,state
,zip
address
- एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
उदाहरण के लिए, आपकी फ़ाइल में x
, y
, और wkt
नाम के कॉलम हैं.
ऊपर दी गई सूची में, इस्तेमाल किए जा सकने वाले कॉलम के नामों के क्रम से यह तय किया जाता है कि x
और y
की प्राथमिकता ज़्यादा है. इसलिए, x
और y
कॉलम की वैल्यू का इस्तेमाल किया जाता है और wkt
कॉलम को अनदेखा कर दिया जाता है.
इसके अलावा:
- हर कॉलम का नाम एक ही कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास
xy
नाम का ऐसा कॉलम नहीं हो सकता जिसमें x और y, दोनों निर्देशांक का डेटा हो. x और y निर्देशांक, अलग-अलग कॉलम में होने चाहिए. - कॉलम के नाम केस-इनसेंसिटिव होते हैं.
- कॉलम के नामों का क्रम मायने नहीं रखता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में
lat
औरlong
कॉलम हैं, तो वे किसी भी क्रम में हो सकते हैं.
डेटा अपलोड करने से जुड़ी गड़बड़ियां ठीक करना
किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी दिख सकती है.
GeoJSON से जुड़ी गड़बड़ियां
GeoJSON में होने वाली आम गड़बड़ियां:
type
फ़ील्ड मौजूद नहीं है याtype
कोई स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, हर फ़ीचर ऑब्जेक्ट और ज्यामिति ऑब्जेक्ट की परिभाषा के हिस्से के तौर पर,type
नाम का एक स्ट्रिंग फ़ील्ड होना चाहिए.
KML से जुड़ी गड़बड़ियां
KML फ़ाइल में होने वाली आम गड़बड़ियां:
- डेटा फ़ाइल में, ऊपर दी गई ऐसी कोई भी KML सुविधा नहीं होनी चाहिए जो काम नहीं करती. ऐसा होने पर, डेटा इंपोर्ट नहीं हो पाएगा.
CSV फ़ाइल में गड़बड़ियां
CSV फ़ाइल में होने वाली आम गड़बड़ियां:
- कुछ पंक्तियों में ज्यामिति कॉलम की वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी लाइनों में, ज्यामिति कॉलम के लिए ऐसी वैल्यू होनी चाहिए जो खाली न हों. ज्यामिति कॉलम में ये शामिल हैं:
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
,zip
address
- एक कॉलम, जिसमें पते की पूरी जानकारी होती है, जैसे कि
1600 Amphitheatre Parkway Mountain View, CA 94043
- अगर
x
औरy
आपके ज्यामिति कॉलम हैं, तो पक्का करें कि यूनिट देशांतर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, हेडरx
औरy
के तहत अलग-अलग निर्देशांक सिस्टम का इस्तेमाल करते हैं. गलत यूनिट का इस्तेमाल करने पर, डेटासेट को इंपोर्ट किया जा सकता है. हालांकि, रेंडर किए गए डेटा में डेटासेट पॉइंट, अनचाही जगहों पर दिख सकते हैं.