দৃশ্য শব্দার্থতত্ত্ব API এর মাধ্যমে ব্যবহারকারীর পরিবেশ বুঝুন

প্ল্যাটফর্ম-নির্দিষ্ট গাইড

দৃশ্য শব্দার্থবিদ্যা

দৃশ্য শব্দার্থবিদ্যা API ডেভেলপারদের ব্যবহারকারীর চারপাশের দৃশ্য বুঝতে সক্ষম করে, যা অনেক উচ্চ-মানের AR অভিজ্ঞতার জন্য প্রয়োজন। একটি ML মডেলের উপর নির্মিত, দৃশ্য শব্দার্থবিদ্যা API রিয়েল-টাইম শব্দার্থিক তথ্য প্রদান করে, যা ARCore-এ বিদ্যমান জ্যামিতিক তথ্যের পরিপূরক।

একটি বহিরঙ্গন দৃশ্যের একটি চিত্র দেওয়া হলে, API প্রতিটি পিক্সেলের জন্য একটি লেবেল প্রদান করে একটি উপযোগী শব্দার্থিক শ্রেণীতে, যেমন আকাশ, ভবন, গাছ, রাস্তা, ফুটপাত, যানবাহন, ব্যক্তি এবং আরও অনেক কিছু। পিক্সেল লেবেল ছাড়াও, দৃশ্য শব্দার্থবিদ্যা API প্রতিটি পিক্সেল লেবেলের জন্য আত্মবিশ্বাসের মান এবং একটি বহিরঙ্গন দৃশ্যে একটি প্রদত্ত লেবেলের ব্যাপকতা অনুসন্ধান করার একটি সহজ-ব্যবহারযোগ্য উপায় প্রদান করে।

বাম থেকে ডানে, একটি ইনপুট চিত্রের উদাহরণ, পিক্সেল লেবেলের শব্দার্থিক চিত্র এবং সংশ্লিষ্ট আত্মবিশ্বাসের চিত্র:

শব্দার্থিক চিত্রের উদাহরণ

Scene Semantics API-এর সাহায্যে, বিকাশকারীরা নির্দিষ্ট দৃশ্যের উপাদানগুলি সনাক্ত করতে পারে, যেমন রাস্তা এবং ফুটপাথ একটি অপরিচিত শহরের মধ্যে দিয়ে একজন ব্যবহারকারীকে গাইড করতে সাহায্য করার জন্য, গতিশীল বস্তুগুলিতে বাধা দেওয়ার জন্য মানুষ এবং যানবাহন, দিনের যে কোনও সময় সূর্যাস্ত তৈরি করতে আকাশ, এবং বিল্ডিংগুলি তাদের চেহারা পরিবর্তন করতে এবং ভার্চুয়াল বস্তুগুলিকে নোঙ্গর করতে।

শব্দার্থিক লেবেল এবং গুণমান

দৃশ্য শব্দার্থবিদ্যা এপিআই একাধিক লেবেল প্রদান করে, প্রতিটিতে একটি সংশ্লিষ্ট গুণমান বা নির্ভরযোগ্যতা রয়েছে। সাধারণত, ML মডেলটি ছোট বা আরও বিরল বস্তু/পৃষ্ঠের শ্রেণীগুলির তুলনায় বৃহত্তর, আরও সাধারণ বস্তু/পৃষ্ঠের শ্রেণীগুলির পূর্বাভাস দিতে সক্ষম। ক্লাসগুলিকে নিম্নোক্ত মানের স্তরে বিভক্ত করা যেতে পারে, উচ্চ থেকে নিম্ন পর্যন্ত র‌্যাঙ্ক করা হয়েছে:

শব্দার্থিক লেবেল মানের স্তর
প্রধান দৃশ্য উপাদান
  • আকাশ
  • ভবন
  • গাছ
  • রাস্তা
  • যানবাহন
প্রধান দৃশ্য বিবরণ
  • ফুটপাথ
  • ভূখণ্ড
  • গঠন
  • জল
ছোট দৃশ্য বিবরণ
  • বস্তু
  • ব্যক্তি

ডিভাইস সামঞ্জস্য

দৃশ্য শব্দার্থতত্ত্ব এপিআই সমর্থিত ডিভাইসগুলির একই তালিকা ডেপথ এপিআই হিসাবে ভাগ করে। উভয় API সমর্থন করে এমন ডিভাইসগুলির একটি আপ-টু-ডেট তালিকার জন্য অনুগ্রহ করে ARCore সমর্থিত ডিভাইসগুলির পৃষ্ঠা দেখুন।

সমর্থিত ব্যবহারের ক্ষেত্রে

দৃশ্য শব্দার্থতত্ত্ব API নিম্নলিখিত পরিস্থিতিতে ব্যবহারের জন্য ডিজাইন করা হয়েছে:

  1. বহিরঙ্গন দৃশ্য : শুধুমাত্র বহিরঙ্গন দৃশ্য সমর্থন করে এবং অভ্যন্তরীণ ব্যবহারের ক্ষেত্রে উদ্দেশ্যে নয়।

  2. পোর্ট্রেট ওরিয়েন্টেশন : শুধুমাত্র ডিভাইসের ডিফল্ট ওরিয়েন্টেশন মোডে (যেমন পোর্ট্রেট) ব্যবহার করা উচিত। ল্যান্ডস্কেপ মোডের জন্য শব্দার্থিক লেবেলের গুণমান নিশ্চিত করা হয় না।