ML Kit এর সাবজেক্ট সেগমেন্টেশন API ডেভেলপারদের একটি ছবির ব্যাকগ্রাউন্ড থেকে একাধিক বিষয়কে সহজেই আলাদা করতে দেয়, স্টিকার তৈরি, ব্যাকগ্রাউন্ড সোয়াপ বা বিষয়গুলিতে দুর্দান্ত প্রভাব যোগ করার মতো ব্যবহারের ক্ষেত্রে সক্ষম করে।
বিষয়গুলিকে চিত্রের অগ্রভাগে সবচেয়ে বিশিষ্ট ব্যক্তি, পোষা প্রাণী বা বস্তু হিসাবে সংজ্ঞায়িত করা হয়৷ যদি 2টি বিষয় খুব কাছাকাছি বা একে অপরকে স্পর্শ করে, তবে সেগুলিকে একক বিষয় হিসাবে বিবেচনা করা হয়।
বিষয় বিভাজন API একটি ইনপুট চিত্র নেয় এবং অগ্রভাগের জন্য একটি আউটপুট মাস্ক বা বিটম্যাপ তৈরি করে। এটি সনাক্ত করা প্রতিটি বিষয়ের জন্য একটি মুখোশ এবং বিটম্যাপ প্রদান করে (পুরোভূমিটি মিলিত সমস্ত বিষয়ের সমান)।
ডিফল্টরূপে, ফোরগ্রাউন্ড মাস্ক এবং ফোরগ্রাউন্ড বিটম্যাপ ইনপুট ইমেজের আকার একই (প্রতিটি বিষয়ের মাস্ক এবং বিটম্যাপের আকার ইনপুট ইমেজের আকার থেকে আলাদা হতে পারে)। মুখোশের প্রতিটি পিক্সেলকে একটি ফ্লোট নম্বর বরাদ্দ করা হয় যার পরিসীমা 0.0
এবং 1.0
এর মধ্যে থাকে। সংখ্যাটি 1.0
এর যত কাছাকাছি হবে, পিক্সেল একটি বিষয়কে প্রতিনিধিত্ব করে তার আত্মবিশ্বাস তত বেশি এবং এর বিপরীতে।
Pixel 7 Pro-তে গড় লেটেন্সি পরিমাপ করা হয় প্রায় 200 ms। এই API বর্তমানে শুধুমাত্র স্ট্যাটিক ইমেজ সমর্থন করে.
মূল ক্ষমতা
- বহু-বিষয় বিভাজন: একত্রিত সমস্ত বিষয়ের জন্য একটি একক মুখোশ এবং বিটম্যাপের পরিবর্তে প্রতিটি পৃথক বিষয়ের জন্য মুখোশ এবং বিটম্যাপ সরবরাহ করে।
- বিষয় স্বীকৃতি: স্বীকৃত বিষয় হল বস্তু, পোষা প্রাণী এবং মানুষ।
- ডিভাইসে প্রক্রিয়াকরণ: সমস্ত প্রক্রিয়াকরণ ডিভাইসে সঞ্চালিত হয়, ব্যবহারকারীর গোপনীয়তা রক্ষা করে এবং নেটওয়ার্ক সংযোগের প্রয়োজন হয় না।
উদাহরণ ফলাফল
ইনপুট ইমেজ | আউটপুট ইমেজ + মাস্ক |
---|---|