তুমি শুরু করার আগে

এই নথিটি ডেটাসেটের সাথে কাজ করার সময় পূর্বশর্ত, সর্বোত্তম অনুশীলন এবং সাধারণ ত্রুটিগুলি বর্ণনা করে৷

পূর্বশর্ত

একটি ডেটাসেট তৈরি করার সময়:

  • আপনার Google ক্লাউড প্রকল্পের মধ্যে প্রদর্শনের নামগুলি অবশ্যই অনন্য হতে হবে৷
  • প্রদর্শনের নাম অবশ্যই 64 বাইটের কম হতে হবে (কারণ এই অক্ষরগুলিকে UTF-8-এ উপস্থাপন করা হয়েছে, কিছু ভাষায় প্রতিটি অক্ষর একাধিক বাইট দ্বারা প্রতিনিধিত্ব করা যেতে পারে)।
  • বর্ণনা অবশ্যই 1000 বাইটের কম হতে হবে।

ডেটা আপলোড করার সময়:

  • সমর্থিত ফাইল প্রকারগুলি হল CSV, GeoJSON, এবং KML৷
  • সর্বাধিক সমর্থিত ফাইলের আকার হল 500 MB৷
  • অ্যাট্রিবিউট কলামের নাম স্ট্রিং "?_" দিয়ে শুরু হতে পারে না।
  • ত্রিমাত্রিক জ্যামিতি সমর্থিত নয়। এতে WKT বিন্যাসে "Z" প্রত্যয় এবং GeoJSON বিন্যাসে উচ্চতা স্থানাঙ্ক অন্তর্ভুক্ত রয়েছে।

ডেটা প্রস্তুতির সর্বোত্তম অনুশীলন

যদি আপনার সোর্স ডেটা জটিল বা বড় হয়, যেমন ঘন বিন্দু, লম্বা লাইনস্ট্রিং বা বহুভুজ (প্রায়শই 50 MB এর থেকে বড় সোর্স ফাইলের আকার এই বিভাগে পড়ে), তাহলে একটি ভিজ্যুয়াল ম্যাপে সেরা পারফরম্যান্স অর্জনের জন্য আপলোড করার আগে আপনার ডেটা সরল করার কথা বিবেচনা করুন।

আপনার ডেটা প্রস্তুত করার জন্য এখানে কিছু সেরা অনুশীলন রয়েছে:

  1. বৈশিষ্ট্য বৈশিষ্ট্য ছোট করুন . শুধুমাত্র আপনার মানচিত্রের শৈলীর জন্য প্রয়োজনীয় বৈশিষ্ট্য বৈশিষ্ট্যগুলি রাখুন, উদাহরণস্বরূপ "আইডি" এবং "বিভাগ"। আপনি একটি অনন্য শনাক্তকারী কী-তে ডেটা-চালিত শৈলী ব্যবহার করে একটি ক্লায়েন্ট অ্যাপ্লিকেশনের একটি বৈশিষ্ট্যে অতিরিক্ত বৈশিষ্ট্য যোগ করতে পারেন। উদাহরণস্বরূপ, ডেটা-চালিত স্টাইলিং সহ রিয়েল টাইমে আপনার ডেটা দেখুন দেখুন।
  2. টাইলের আকার ছোট করতে এবং মানচিত্রের কার্যকারিতা উন্নত করতে যেখানে সম্ভব সম্পত্তি বস্তুর জন্য সাধারণ ডেটা প্রকারগুলি ব্যবহার করুন , যেমন পূর্ণসংখ্যা।
  3. একটি ফাইল আপলোড করার আগে জটিল জ্যামিতি সহজ করুন । আপনি এটি আপনার পছন্দের একটি ভূ-স্থানিক টুলে করতে পারেন, যেমন ওপেন সোর্স Mapshaper.org ইউটিলিটি, অথবা জটিল বহুভুজ জ্যামিতিতে ST_Simplify ব্যবহার করে BigQuery-এ।
  4. একটি ফাইল আপলোড করার আগে ক্লাস্টার খুব ঘন পয়েন্ট . আপনি এটি আপনার পছন্দের একটি জিওস্পেশিয়াল টুলে করতে পারেন, যেমন ওপেন সোর্স turf.js ক্লাস্টার ফাংশন বা BigQuery-এ ঘন বিন্দু জ্যামিতিতে ST_CLUSTERDBSCAN ব্যবহার করে।

ডেটাসেট এবং BigQuery-এর সাথে আপনার ডেটা ভিজ্যুয়ালাইজ- এ ডেটাসেটের সেরা অনুশীলন সম্পর্কে অতিরিক্ত নির্দেশিকা দেখুন।

GeoJSON প্রয়োজনীয়তা

মানচিত্র ডেটাসেট API বর্তমান GeoJSON স্পেসিফিকেশন সমর্থন করে। মানচিত্র ডেটাসেট API এছাড়াও GeoJSON ফাইলগুলিকে সমর্থন করে যেগুলিতে নিম্নলিখিত অবজেক্টের ধরনগুলির মধ্যে একটি রয়েছে:

  • জ্যামিতি বস্তু । একটি জ্যামিতি বস্তু হল একটি স্থানিক আকৃতি, যা ঐচ্ছিক ছিদ্র সহ বিন্দু, রেখা এবং বহুভুজের মিলন হিসাবে বর্ণনা করা হয়।
  • বৈশিষ্ট্য বস্তু . একটি বৈশিষ্ট্য বস্তুতে একটি জ্যামিতি এবং অতিরিক্ত নাম/মান জোড়া রয়েছে, যার অর্থ অ্যাপ্লিকেশন-নির্দিষ্ট।
  • বৈশিষ্ট্য সংগ্রহ . একটি বৈশিষ্ট্য সংগ্রহ বৈশিষ্ট্য বস্তুর একটি সেট.

মানচিত্র ডেটাসেট API জিওজেএসএন ফাইলগুলিকে সমর্থন করে না যেগুলির ডাটা রয়েছে WGS84 ব্যতীত অন্য একটি স্থানাঙ্ক রেফারেন্স সিস্টেমে (CRS)৷

GeoJSON সম্পর্কে আরও তথ্যের জন্য, RFC 7946 অনুবর্তী দেখুন।

KML প্রয়োজনীয়তা

মানচিত্র ডেটাসেট API-এর নিম্নলিখিত প্রয়োজনীয়তা রয়েছে:

  • সমস্ত URL অবশ্যই ফাইলের সাথে স্থানীয় (বা আপেক্ষিক) হতে হবে।
  • বিন্দু, রেখা এবং বহুভুজ জ্যামিতি সমর্থিত।
  • সমস্ত ডেটা বৈশিষ্ট্য স্ট্রিং হিসাবে বিবেচিত হয়।
নিম্নলিখিত KML বৈশিষ্ট্য সমর্থিত নয়:
  • আইকন বা <styleUrl> ফাইলের বাইরে সংজ্ঞায়িত।
  • নেটওয়ার্ক লিঙ্ক, যেমন <NetworkLink>
  • গ্রাউন্ড ওভারলে, যেমন <GroundOverlay>
  • 3D জ্যামিতি বা যেকোনো উচ্চতা-সম্পর্কিত ট্যাগ যেমন <altitudeMode>
  • ক্যামেরা স্পেসিফিকেশন যেমন <LookAt>
  • KML ফাইলের ভিতরে শৈলী সংজ্ঞায়িত করা হয়েছে।

CSV প্রয়োজনীয়তা

CSV ফাইলগুলির জন্য, সমর্থিত কলামের নামগুলি অগ্রাধিকারের ক্রমে নীচে তালিকাভুক্ত করা হয়েছে:

  • latitude , longitude
  • lat , long
  • x , y
  • wkt (সুপরিচিত পাঠ্য)
  • address , city , state , zip
  • address
  • একটি একক কলাম যেখানে সমস্ত ঠিকানার তথ্য রয়েছে, যেমন 1600 Amphitheatre Parkway Mountain View, CA 94043

উদাহরণস্বরূপ, আপনার ফাইলে x , y , এবং wkt নামে কলাম রয়েছে। কারণ x এবং y একটি উচ্চতর অগ্রাধিকার রয়েছে, উপরের তালিকায় সমর্থিত কলামের নামের ক্রম দ্বারা নির্ধারিত, x এবং y কলামের মান ব্যবহার করা হয় এবং wkt কলাম উপেক্ষা করা হয়।

উপরন্তু:

  • প্রতিটি কলামের নাম অবশ্যই একটি একক কলামের অন্তর্গত। অর্থাৎ, আপনার xy নামে একটি কলাম থাকতে পারে না যেখানে x এবং y উভয় স্থানাঙ্ক ডেটা রয়েছে। x এবং y স্থানাঙ্ক অবশ্যই পৃথক কলামে থাকতে হবে।
  • কলামের নাম অক্ষর-সংবেদনশীল।
  • কলাম নামের ক্রম কোন ব্যাপার না. উদাহরণস্বরূপ, যদি আপনার CSV ফাইলে lat এবং long কলাম থাকে, সেগুলি যেকোনো ক্রমে ঘটতে পারে।

ডেটা আপলোড ত্রুটিগুলি পরিচালনা করুন৷

একটি ডেটাসেটে ডেটা আপলোড করার সময়, আপনি এই বিভাগে বর্ণিত সাধারণ ত্রুটিগুলির একটির সম্মুখীন হতে পারেন৷

GeoJSON ত্রুটি

সাধারণ GeoJSON ত্রুটির মধ্যে রয়েছে:

  • অনুপস্থিত type ক্ষেত্র, বা type একটি স্ট্রিং নয়। আপলোড করা GeoJSON ডেটা ফাইলে প্রতিটি বৈশিষ্ট্য অবজেক্ট এবং জ্যামিতি অবজেক্ট সংজ্ঞার অংশ হিসাবে type নামে একটি স্ট্রিং ক্ষেত্র থাকতে হবে।

KML ত্রুটি

সাধারণ KML ত্রুটিগুলির মধ্যে রয়েছে:

  • ডেটা ফাইলে উপরে তালিকাভুক্ত কোনো অসমর্থিত KML বৈশিষ্ট্য থাকা উচিত নয়, অন্যথায় ডেটা আমদানি ব্যর্থ হতে পারে।

CSV ত্রুটি

সাধারণ CSV ত্রুটিগুলির মধ্যে রয়েছে:

  • কিছু সারি একটি জ্যামিতি কলামের জন্য মান অনুপস্থিত. একটি CSV ফাইলের সমস্ত সারিতে জ্যামিতি কলামগুলির জন্য অ-খালি মান থাকতে হবে৷ জ্যামিতি কলাম অন্তর্ভুক্ত:
    • latitude , longitude
    • lat , long
    • x , y
    • wkt
    • address , city , state , zip
    • address
    • একটি একক কলাম যেখানে সমস্ত ঠিকানার তথ্য রয়েছে, যেমন 1600 Amphitheatre Parkway Mountain View, CA 94043
  • যদি x এবং y আপনার জ্যামিতি কলাম হয়, নিশ্চিত করুন যে ইউনিটগুলি দ্রাঘিমাংশ এবং অক্ষাংশ। কিছু পাবলিক ডেটাসেট x এবং y শিরোনামের অধীনে বিভিন্ন স্থানাঙ্ক সিস্টেম ব্যবহার করে। ভুল ইউনিট ব্যবহার করা হলে, ডেটাসেট সফলভাবে আমদানি করতে পারে, কিন্তু রেন্ডার করা ডেটা অপ্রত্যাশিত অবস্থানে ডেটাসেট পয়েন্টগুলি দেখাতে পারে।