आरंभ करने से पहले

इस दस्तावेज़ में, डेटासेट इस्तेमाल करने से जुड़ी ज़रूरी शर्तें, सबसे सही तरीके, और सामान्य गड़बड़ियों के बारे में बताया गया है.

ज़रूरी शर्तें

डेटासेट बनाते समय:

डिसप्ले नेम, आपके Google Cloud प्रोजेक्ट में यूनीक होने चाहिए.
डिसप्ले नेम 64 बाइट से कम होने चाहिए. ऐसा इसलिए, क्योंकि इन वर्णों को UTF-8 में दिखाया जाता है. कुछ भाषाओं में, हर वर्ण को कई बाइट से दिखाया जा सकता है.
ब्यौरे 1,000 बाइट से कम होने चाहिए.

डेटा अपलोड करते समय:

CSV, GeoJSON, और KML फ़ाइल टाइप का इस्तेमाल किया जा सकता है.
ज़्यादा से ज़्यादा 500 एमबी की फ़ाइल अपलोड की जा सकती है.
एट्रिब्यूट कॉलम के नाम, "?_" स्ट्रिंग से शुरू नहीं हो सकते.
थ्री-डाइमेंशनल ज्यामिति का इस्तेमाल नहीं किया जा सकता. इसमें WKT फ़ॉर्मैट में "Z" सफ़िक्स और GeoJSON फ़ॉर्मैट में ऊंचाई का कोऑर्डिनेट शामिल है.

ध्यान दें: Maps Datasets API का इस्तेमाल करके अपलोड किए गए डेटा से बनाई गई मैप टाइलें, कम ज़ूम लेवल पर ज़्यादा या जटिल डेटा को हटा सकती हैं या उसे आसान बना सकती हैं. उदाहरण के लिए, जब कोई उपयोगकर्ता किसी राज्य या देश को ज़ूम आउट करता है (उदाहरण के लिए, ज़ूम लेवल 5 से 12), तो टाइल किया गया डेटा, किसी शहर या आस-पास के इलाके को ज़ूम इन करने (उदाहरण के लिए, ज़ूम लेवल 13 से 18) पर दिखने वाले डेटा से अलग दिख सकता है. ऐसा इसलिए होता है, ताकि मैप रेंडरर के साथ टाइल का इस्तेमाल करके, टाइल को छोटा और बेहतर बनाया जा सके.

अहम जानकारी: अगर आपकी डेटा फ़ाइल बड़ी है और उसमें ऐसे कई एट्रिब्यूट हैं जिनकी स्टाइलिंग के लिए आपको ज़रूरत नहीं है, तो रेंडरिंग की परफ़ॉर्मेंस को ऑप्टिमाइज़ करने के लिए, फ़ाइल में बदलाव करके गैर-ज़रूरी एट्रिब्यूट हटाएं. एट्रिब्यूट की संख्या कम करने से, मैप की टाइल का साइज़ कम हो जाता है. इससे रेंडरिंग की परफ़ॉर्मेंस बेहतर होती है.

डेटा तैयार करने के सबसे सही तरीके

अगर आपका सोर्स डेटा जटिल या बड़ा है, जैसे कि डेंस पॉइंट, लंबी लाइनस्ट्रिंग या पॉलीगॉन (अक्सर 50 एमबी से ज़्यादा साइज़ वाली सोर्स फ़ाइलें इस कैटगरी में आती हैं), तो विज़ुअल मैप में बेहतर परफ़ॉर्मेंस पाने के लिए, डेटा को अपलोड करने से पहले उसे आसान बनाएं.

डेटा तैयार करने के कुछ सबसे सही तरीके यहां दिए गए हैं:

सुविधा की प्रॉपर्टी कम से कम रखें. अपने मैप को स्टाइल करने के लिए, सिर्फ़ ज़रूरी फ़ीचर प्रॉपर्टी रखें. उदाहरण के लिए, "id" और "category". यूनीक आइडेंटिफ़ायर कुंजी पर डेटा-ड्रिवन स्टाइल का इस्तेमाल करके, क्लाइंट ऐप्लिकेशन में किसी सुविधा से अतिरिक्त प्रॉपर्टी जोड़ी जा सकती हैं. उदाहरण के लिए, डेटा-ड्रिवन स्टाइलिंग की मदद से, रीयल टाइम में अपना डेटा देखना लेख पढ़ें.
जहां हो सके वहां प्रॉपर्टी ऑब्जेक्ट के लिए, सामान्य डेटा टाइप का इस्तेमाल करें. जैसे, पूर्णांक. इससे टाइल का साइज़ कम करने और मैप की परफ़ॉर्मेंस को बेहतर बनाने में मदद मिलती है.
फ़ाइल अपलोड करने से पहले, जटिल ज्यामिति को आसान बनाएं. इसके लिए, अपनी पसंद का कोई भी जियोस्पेशल टूल इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स Mapshaper.org यूटिलिटी. इसके अलावा, BigQuery में ST_Simplify फ़ंक्शन का इस्तेमाल करके भी ऐसा किया जा सकता है.
फ़ाइल अपलोड करने से पहले, बहुत ज़्यादा पॉइंट वाले क्लस्टर बनाएं. इसके लिए, अपनी पसंद का कोई जियोस्पेशल टूल इस्तेमाल किया जा सकता है. जैसे, ओपन सोर्स turf.js क्लस्टर फ़ंक्शन. इसके अलावा, BigQuery में ST_CLUSTERDBSCAN का इस्तेमाल करके भी ऐसा किया जा सकता है. हालांकि, यह फ़ंक्शन सिर्फ़ पॉइंट के डेंस ज्योमेट्री पर काम करता है.

डेटासेट के सबसे सही तरीकों के बारे में ज़्यादा जानकारी के लिए, डेटासेट और BigQuery की मदद से अपने डेटा को विज़ुअलाइज़ करना लेख पढ़ें.

GeoJSON की ज़रूरी शर्तें

Maps Datasets API, मौजूदा GeoJSON स्पेसिफ़िकेशन के साथ काम करता है. Maps Datasets API, GeoJSON फ़ाइलों के साथ भी काम करता है. इन फ़ाइलों में, यहां दिए गए किसी भी ऑब्जेक्ट टाइप का डेटा हो सकता है:

ज्यामिति के ऑब्जेक्ट. ज्यामिति ऑब्जेक्ट, एक स्पेशल शेप होता है. इसे पॉइंट, लाइन, और पॉलीगॉन के यूनियन के तौर पर दिखाया जाता है. इसमें छेद भी हो सकते हैं.
सुविधा ऑब्जेक्ट. फ़ीचर ऑब्जेक्ट में, ज्यामिति के साथ-साथ नाम/वैल्यू के अतिरिक्त जोड़े भी शामिल होते हैं. इनका मतलब, ऐप्लिकेशन के हिसाब से अलग-अलग होता है.
सुविधाओं के कलेक्शन. फ़ीचर कलेक्शन, फ़ीचर ऑब्जेक्ट का एक सेट होता है.

Maps Datasets API, ऐसी GeoJSON फ़ाइलों के साथ काम नहीं करता है जिनमें WGS84 के अलावा किसी अन्य कोऑर्डिनेट रेफ़रंस सिस्टम (सीआरएस) में डेटा होता है.

GeoJSON के बारे में ज़्यादा जानने के लिए, RFC 7946 के मुताबिक देखें.

KML की ज़रूरी शर्तें

Maps Datasets API के लिए ये ज़रूरी शर्तें हैं:

सभी यूआरएल, फ़ाइल के हिसाब से लोकल (या रिलेटिव) होने चाहिए.
पॉइंट, लाइन, और पॉलीगॉन ज्यामिति के साथ काम करता है.
सभी डेटा एट्रिब्यूट को स्ट्रिंग माना जाता है.

KML की ये सुविधाएं काम नहीं करतीं:

फ़ाइल के बाहर तय किए गए आइकॉन या <styleUrl>.
नेटवर्क लिंक, जैसे कि <NetworkLink>
ग्राउंड ओवरले, जैसे कि <GroundOverlay>
3D ज्यामिति या ऊंचाई से जुड़े कोई भी टैग, जैसे कि <altitudeMode>
कैमरे की खास जानकारी, जैसे कि <LookAt>
KML फ़ाइल में तय की गई स्टाइल.

CSV फ़ाइल से जुड़ी ज़रूरी शर्तें

CSV फ़ाइलों के लिए, प्राथमिकता के क्रम में कॉलम के ये नाम इस्तेमाल किए जा सकते हैं:

latitude, longitude
lat, long
x, y
wkt (वेल-नोन टेक्स्ट)
address, city, state, zip
address
एक ही कॉलम में पते की पूरी जानकारी, जैसे कि 1600 Amphitheatre Parkway Mountain View, CA 94043

उदाहरण के लिए, आपकी फ़ाइल में x, y, और wkt नाम के कॉलम मौजूद हैं. x और y को ज़्यादा प्राथमिकता दी जाती है. यह प्राथमिकता, ऊपर दी गई सूची में कॉलम के नामों के क्रम के हिसाब से तय की जाती है. इसलिए, x और y कॉलम में मौजूद वैल्यू का इस्तेमाल किया जाता है और wkt कॉलम को अनदेखा कर दिया जाता है.

इसके अलावा:

हर कॉलम का नाम, सिर्फ़ एक कॉलम से जुड़ा होना चाहिए. इसका मतलब है कि आपके पास xy नाम का कोई ऐसा कॉलम नहीं हो सकता जिसमें x और y, दोनों कोऑर्डिनेट का डेटा शामिल हो. x और y कोऑर्डिनेट अलग-अलग कॉलम में होने चाहिए.
कॉलम के नाम केस-इनसेंसिटिव होते हैं.
कॉलम के नामों का क्रम मायने नहीं रखता. उदाहरण के लिए, अगर आपकी CSV फ़ाइल में lat और long कॉलम हैं, तो ये किसी भी क्रम में हो सकते हैं.

डेटा अपलोड करने से जुड़ी गड़बड़ियां ठीक करना

किसी डेटासेट में डेटा अपलोड करते समय, आपको इस सेक्शन में बताई गई सामान्य गड़बड़ियों में से कोई एक गड़बड़ी दिख सकती है.

GeoJSON से जुड़ी गड़बड़ियां

GeoJSON में आम तौर पर होने वाली गड़बड़ियां:

type फ़ील्ड मौजूद नहीं है या type स्ट्रिंग नहीं है. अपलोड की गई GeoJSON डेटा फ़ाइल में, हर Feature ऑब्जेक्ट और Geometry ऑब्जेक्ट की परिभाषा के हिस्से के तौर पर, type नाम का एक स्ट्रिंग फ़ील्ड होना चाहिए.

KML से जुड़ी गड़बड़ियां

KML से जुड़ी आम गड़बड़ियां:

डेटा फ़ाइल में, ऊपर दी गई KML की ऐसी कोई सुविधा नहीं होनी चाहिए जिसका इस्तेमाल नहीं किया जा सकता. ऐसा न होने पर, डेटा इंपोर्ट नहीं हो पाएगा.

CSV फ़ाइल में गड़बड़ियां

CSV फ़ाइल में आम तौर पर होने वाली गड़बड़ियां:

कुछ पंक्तियों में, ज्यामिति कॉलम के लिए वैल्यू मौजूद नहीं हैं. CSV फ़ाइल की सभी लाइनों में, ज्यामिति कॉलम के लिए खाली नहीं की गई वैल्यू होनी चाहिए. ज्यामिति कॉलम में ये शामिल हैं:
- latitude, longitude
- lat, long
- x, y
- wkt
- address, city, state, zip
- address
- एक ही कॉलम में पते की पूरी जानकारी, जैसे कि 1600 Amphitheatre Parkway Mountain View, CA 94043
ध्यान दें: इस गड़बड़ी के बारे में अक्सर इस तरह के मैसेज से पता चलता है: " ' ' को डबल में नहीं बदला जा सकता" या "इनपुट को भूगोल में पार्स नहीं किया जा सका.: ज्यामिति की वैल्यू मौजूद नहीं है".
अगर x और y आपके ज्यामिति कॉलम हैं, तो पक्का करें कि इकाइयां देशांतर और अक्षांश हों. कुछ सार्वजनिक डेटासेट, x और y हेडर में अलग-अलग कोऑर्डिनेट सिस्टम का इस्तेमाल करते हैं. अगर गलत यूनिट का इस्तेमाल किया जाता है, तो हो सकता है कि डेटासेट इंपोर्ट हो जाए. हालांकि, रेंडर किए गए डेटा में, डेटासेट पॉइंट अनचाही जगहों पर दिख सकते हैं.