তুমি শুরু করার আগে

এই নথিতে ডেটাসেটগুলির সাথে কাজ করার সময় পূর্বশর্ত, সর্বোত্তম অনুশীলন এবং সাধারণ ত্রুটিগুলি বর্ণনা করা হয়েছে।

পূর্বশর্ত

একটি ডেটাসেট তৈরি করার সময়:

  • আপনার Google Cloud প্রোজেক্টের মধ্যে ডিসপ্লে নামগুলি অবশ্যই অনন্য হতে হবে।
  • প্রদর্শনের নামগুলি অবশ্যই 64 বাইটের কম হতে হবে (যেহেতু এই অক্ষরগুলি UTF-8 তে প্রতিনিধিত্ব করা হয়, কিছু ভাষায় প্রতিটি অক্ষর একাধিক বাইট দ্বারা প্রতিনিধিত্ব করা যেতে পারে)।
  • বর্ণনা অবশ্যই ১০০০ বাইটের কম হতে হবে।

ডেটা আপলোড করার সময়:

  • সমর্থিত ফাইলের ধরণগুলি হল CSV, GeoJSON এবং KML।
  • সর্বাধিক সমর্থিত ফাইলের আকার ৫০০ মেগাবাইট।
  • অ্যাট্রিবিউট কলামের নাম "?_" স্ট্রিং দিয়ে শুরু হতে পারে না।
  • ত্রিমাত্রিক জ্যামিতি সমর্থিত নয়। এর মধ্যে WKT ফর্ম্যাটে "Z" প্রত্যয় এবং GeoJSON ফর্ম্যাটে উচ্চতা স্থানাঙ্ক অন্তর্ভুক্ত রয়েছে।

তথ্য প্রস্তুতির সর্বোত্তম অনুশীলন

যদি আপনার উৎস ডেটা জটিল বা বড় হয়, যেমন ঘন বিন্দু, লম্বা লাইনস্ট্রিং বা বহুভুজ (প্রায়শই ৫০ মেগাবাইটের চেয়ে বড় উৎস ফাইলের আকার এই বিভাগে পড়ে), তাহলে ভিজ্যুয়াল মানচিত্রে সেরা কর্মক্ষমতা অর্জনের জন্য আপলোড করার আগে আপনার ডেটা সরলীকরণের কথা বিবেচনা করুন।

আপনার ডেটা প্রস্তুত করার জন্য এখানে কিছু সেরা অনুশীলন দেওয়া হল:

  1. বৈশিষ্ট্য বৈশিষ্ট্যগুলি ছোট করুন । আপনার মানচিত্র স্টাইল করার জন্য প্রয়োজনীয় বৈশিষ্ট্য বৈশিষ্ট্যগুলি কেবল রাখুন, যেমন "id" এবং "category"। আপনি একটি অনন্য শনাক্তকারী কীতে ডেটা-চালিত স্টাইল ব্যবহার করে ক্লায়েন্ট অ্যাপ্লিকেশনের একটি বৈশিষ্ট্যে অতিরিক্ত বৈশিষ্ট্য যুক্ত করতে পারেন। উদাহরণস্বরূপ, ডেটা-চালিত স্টাইলিং সহ রিয়েল টাইমে আপনার ডেটা দেখুন দেখুন।
  2. টাইলের আকার কমাতে এবং মানচিত্রের কর্মক্ষমতা উন্নত করতে, যেখানে সম্ভব, সম্পত্তির বস্তুর জন্য সহজ ডেটা টাইপ ব্যবহার করুন , যেমন পূর্ণসংখ্যা।
  3. ফাইল আপলোড করার আগে জটিল জ্যামিতি সরলীকৃত করুন । আপনি এটি আপনার পছন্দের একটি ভূ-স্থানিক সরঞ্জামে করতে পারেন, যেমন ওপেন সোর্স Mapshaper.org ইউটিলিটি, অথবা জটিল বহুভুজ জ্যামিতিতে ST_Simplify ব্যবহার করে BigQuery-তে।
  4. ফাইল আপলোড করার আগে খুব ঘন বিন্দুগুলিকে ক্লাস্টার করুন । আপনি এটি আপনার পছন্দের একটি ভূ-স্থানিক সরঞ্জামে করতে পারেন, যেমন ওপেন সোর্স turf.js ক্লাস্টার ফাংশন , অথবা BigQuery-তে ঘন বিন্দু জ্যামিতিতে ST_CLUSTERDBSCAN ব্যবহার করে।

ডেটাসেটের সেরা অনুশীলন সম্পর্কে অতিরিক্ত নির্দেশিকা দেখুন "Visualize your data with Datasets" এবং "BigQuery" বিভাগে

GeoJSON এর প্রয়োজনীয়তা

Maps Datasets API বর্তমান GeoJSON স্পেসিফিকেশন সমর্থন করে। Maps Datasets API GeoJSON ফাইলগুলিকেও সমর্থন করে যেখানে নিম্নলিখিত যেকোনো ধরণের অবজেক্ট থাকে:

  • জ্যামিতি বস্তু । একটি জ্যামিতি বস্তু হল একটি স্থানিক আকৃতি, যা ঐচ্ছিক ছিদ্র সহ বিন্দু, রেখা এবং বহুভুজের মিলন হিসাবে বর্ণনা করা হয়।
  • ফিচার অবজেক্ট । একটি ফিচার অবজেক্টে একটি জ্যামিতি এবং অতিরিক্ত নাম/মান জোড়া থাকে, যার অর্থ প্রয়োগ-নির্দিষ্ট।
  • ফিচার কালেকশন । ফিচার কালেকশন হলো ফিচার অবজেক্টের একটি সেট।

WGS84 ব্যতীত অন্য কোনও স্থানাঙ্ক রেফারেন্স সিস্টেমে (CRS) ডেটা থাকা GeoJSON ফাইলগুলিকে Maps Datasets API সমর্থন করে না।

GeoJSON সম্পর্কে আরও তথ্যের জন্য, RFC 7946 অনুবর্তী দেখুন।

KML প্রয়োজনীয়তা

ম্যাপস ডেটাসেটস এপিআই-এর নিম্নলিখিত প্রয়োজনীয়তা রয়েছে:

  • সমস্ত URL ফাইলের স্থানীয় (অথবা আপেক্ষিক) হতে হবে।
  • বিন্দু, রেখা এবং বহুভুজ জ্যামিতি সমর্থিত।
  • সমস্ত ডেটা অ্যাট্রিবিউটকে স্ট্রিং হিসেবে বিবেচনা করা হয়।
নিম্নলিখিত KML বৈশিষ্ট্যগুলি সমর্থিত নয়:
  • ফাইলের বাইরে সংজ্ঞায়িত আইকন অথবা <styleUrl>
  • নেটওয়ার্ক লিঙ্ক, যেমন <NetworkLink>
  • গ্রাউন্ড ওভারলে, যেমন <GroundOverlay>
  • 3D জ্যামিতি অথবা উচ্চতা-সম্পর্কিত যেকোনো ট্যাগ যেমন <altitudeMode>
  • ক্যামেরার স্পেসিফিকেশন যেমন <LookAt>
  • KML ফাইলের ভিতরে সংজ্ঞায়িত স্টাইল।

CSV-এর প্রয়োজনীয়তা

CSV ফাইলের জন্য, সমর্থিত কলামের নামগুলি অগ্রাধিকারের ক্রম অনুসারে নীচে তালিকাভুক্ত করা হয়েছে:

  • latitude , longitude
  • lat , long
  • x , y
  • wkt (সুপরিচিত লেখা)
  • address , city , state , zip
  • address
  • 1600 Amphitheatre Parkway Mountain View, CA 94043 মতো সমস্ত ঠিকানার তথ্য সম্বলিত একটি একক কলামে

উদাহরণস্বরূপ, আপনার ফাইলে x , y , এবং wkt নামের কলাম রয়েছে। যেহেতু x এবং y এর অগ্রাধিকার বেশি, উপরের তালিকার সমর্থিত কলামের নামের ক্রম অনুসারে, x এবং y কলামের মান ব্যবহার করা হয় এবং wkt কলামটি উপেক্ষা করা হয়।

এছাড়াও:

  • প্রতিটি কলামের নাম অবশ্যই একটি একক কলামের অন্তর্গত হতে হবে। অর্থাৎ, xy নামে এমন কোনও কলামে x এবং y উভয় স্থানাঙ্কের ডেটা থাকতে পারে না। x এবং y স্থানাঙ্কগুলি পৃথক কলামে থাকতে হবে।
  • কলামের নামগুলি কেস-সংবেদনশীল নয়।
  • কলামের নামের ক্রম কোন ব্যাপার না। উদাহরণস্বরূপ, যদি আপনার CSV ফাইলে lat এবং long কলাম থাকে, তাহলে সেগুলি যেকোনো ক্রমে হতে পারে।

ডেটা আপলোড ত্রুটিগুলি পরিচালনা করুন

ডেটাসেটে ডেটা আপলোড করার সময়, আপনি এই বিভাগে বর্ণিত সাধারণ ত্রুটিগুলির মধ্যে একটির সম্মুখীন হতে পারেন।

GeoJSON ত্রুটি

সাধারণ GeoJSON ত্রুটিগুলির মধ্যে রয়েছে:

  • type ফিল্ডটি অনুপস্থিত, অথবা type কোনও স্ট্রিং নয়। আপলোড করা GeoJSON ডেটা ফাইলে প্রতিটি ফিচার অবজেক্ট এবং জ্যামিতি অবজেক্টের সংজ্ঞার অংশ হিসেবে type নামে একটি স্ট্রিং ফিল্ড থাকতে হবে।

KML ত্রুটি

সাধারণ KML ত্রুটিগুলির মধ্যে রয়েছে:

  • ডেটা ফাইলে উপরে তালিকাভুক্ত কোনও অসমর্থিত KML বৈশিষ্ট্য থাকা উচিত নয়, অন্যথায় ডেটা আমদানি ব্যর্থ হতে পারে।

CSV ত্রুটি

সাধারণ CSV ত্রুটিগুলির মধ্যে রয়েছে:

  • কিছু সারিতে জ্যামিতি কলামের মান অনুপস্থিত। CSV ফাইলের সমস্ত সারিতে জ্যামিতি কলামের জন্য খালি নয় এমন মান থাকতে হবে। জ্যামিতি কলামের মধ্যে রয়েছে:
    • latitude , longitude
    • lat , long
    • x , y
    • wkt
    • address , city , state , zip
    • address
    • 1600 Amphitheatre Parkway Mountain View, CA 94043 মতো সমস্ত ঠিকানার তথ্য সম্বলিত একটি একক কলামে
  • যদি x এবং y আপনার জ্যামিতি কলাম হয়, তাহলে নিশ্চিত করুন যে ইউনিটগুলি দ্রাঘিমাংশ এবং অক্ষাংশ। কিছু পাবলিক ডেটাসেট x এবং y শিরোনামের অধীনে বিভিন্ন স্থানাঙ্ক সিস্টেম ব্যবহার করে। যদি ভুল ইউনিট ব্যবহার করা হয়, তাহলে ডেটাসেটটি সফলভাবে আমদানি করতে পারে, কিন্তু রেন্ডার করা ডেটা অপ্রত্যাশিত স্থানে ডেটাসেট পয়েন্ট দেখাতে পারে।