ইমেজ লেবেলিং

ML Kit-এর ইমেজ লেবেলিং এপিআই-এর সাহায্যে আপনি একটি বিস্তৃত শ্রেণীতে একটি ইমেজে সত্তা সম্পর্কে তথ্য সনাক্ত করতে এবং বের করতে পারেন। ডিফল্ট ইমেজ লেবেলিং মডেল সাধারণ বস্তু, স্থান, কার্যকলাপ, প্রাণীর প্রজাতি, পণ্য এবং আরও অনেক কিছু সনাক্ত করতে পারে।

আপনি একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে সনাক্তকরণের জন্য একটি কাস্টম চিত্র শ্রেণীবিভাগ মডেল ব্যবহার করতে পারেন। আরও তথ্যের জন্য একটি কাস্টম টেনসরফ্লো লাইট মডেল ব্যবহার করা দেখুন।

  • একটি শক্তিশালী সাধারণ-উদ্দেশ্য বেস ক্লাসিফায়ার 400 টিরও বেশি বিভাগকে শনাক্ত করে যা ফটোতে সর্বাধিক পাওয়া বস্তুগুলিকে বর্ণনা করে৷
  • কাস্টম মডেলগুলির সাথে আপনার ব্যবহারের ক্ষেত্রে উপযোগী করুন টেনসরফ্লো হাব থেকে অন্যান্য প্রাক-প্রশিক্ষিত মডেল বা টেনসরফ্লো, অটোএমএল ভিশন এজ বা টেনসরফ্লো লাইট মডেল মেকারের সাথে প্রশিক্ষিত আপনার নিজস্ব কাস্টম মডেল ব্যবহার করুন৷
  • সহজে-ব্যবহারযোগ্য উচ্চ-স্তরের এপিআইগুলি নিম্ন-স্তরের মডেল ইনপুট/আউটপুট, চিত্রের পূর্ব এবং পরবর্তী প্রক্রিয়াকরণ, বা একটি প্রক্রিয়াকরণ পাইপলাইন নির্মাণের সাথে মোকাবিলা করার প্রয়োজন নেই। ML Kit TensorFlow Lite মডেল থেকে লেবেলগুলি বের করে এবং সেগুলিকে একটি পাঠ্য বিবরণ হিসাবে প্রদান করে৷

মনে রাখবেন যে এই APIটি ইমেজ ক্লাসিফিকেশন মডেলের জন্য তৈরি করা হয়েছে যা সম্পূর্ণ ইমেজ বর্ণনা করে। একটি ছবিতে এক বা একাধিক বস্তুর শ্রেণিবিন্যাস করার জন্য, যেমন জুতা বা আসবাবের টুকরো, অবজেক্ট ডিটেকশন অ্যান্ড ট্র্যাকিং এপিআই একটি ভাল ফিট হতে পারে।

সমর্থিত ইমেজ শ্রেণীবিভাগ মডেল

ইমেজ লেবেলিং এপিআই বিভিন্ন ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করে:

সমর্থিত ইমেজ শ্রেণীবিভাগ মডেল
বেস মডেল ডিফল্টরূপে API একটি শক্তিশালী সাধারণ-উদ্দেশ্য ইমেজ লেবেলিং মডেল ব্যবহার করে যা 400 টিরও বেশি সত্ত্বাকে স্বীকৃতি দেয় যা ফটোতে সবচেয়ে সাধারণভাবে পাওয়া ধারণাগুলিকে কভার করে৷
কাস্টম টেনসরফ্লো লাইট মডেল অ্যাপ্লিকেশান-নির্দিষ্ট ধারণাগুলিকে লক্ষ্য করতে, API বিস্তৃত উত্স থেকে কাস্টম চিত্র শ্রেণীবিভাগ মডেলগুলি গ্রহণ করে৷ এগুলি হতে পারে টেনসরফ্লো হাব থেকে ডাউনলোড করা প্রাক-প্রশিক্ষিত মডেল বা অটোএমএল ভিশন এজ, টেনসরফ্লো লাইট মডেল মেকার বা টেনসরফ্লো নিজে প্রশিক্ষিত আপনার নিজের মডেল। মডেলগুলি আপনার অ্যাপের সাথে বান্ডিল করা যেতে পারে বা Firebase মেশিন লার্নিং দিয়ে হোস্ট করা যেতে পারে এবং রান-টাইমে ডাউনলোড করা যেতে পারে।

বেস মডেল ব্যবহার করে

ML Kit-এর বেস মডেলটি সত্তার একটি তালিকা প্রদান করে যা মানুষ, জিনিস, স্থান, কার্যকলাপ ইত্যাদি সনাক্ত করে। প্রতিটি সত্তা একটি স্কোর নিয়ে আসে যা নির্দেশ করে যে ML মডেলের প্রাসঙ্গিকতার উপর আস্থা রয়েছে। এই তথ্য দিয়ে, আপনি স্বয়ংক্রিয় মেটাডেটা তৈরি এবং বিষয়বস্তু সংযম করার মতো কাজগুলি সম্পাদন করতে পারেন৷ এমএল কিটের সাথে প্রদত্ত ডিফল্ট মডেলটি 400 টিরও বেশি বিভিন্ন সত্তাকে স্বীকৃতি দেয়৷

iOS অ্যান্ড্রয়েড

উদাহরণ লেবেল

ইমেজ লেবেলিং API-এর বেস মডেল 400+ লেবেল সমর্থন করে, যেমন নিম্নলিখিত উদাহরণগুলি:

শ্রেণী উদাহরণ লেবেল
মানুষ Crowd
Selfie
Smile
কার্যক্রম Dancing
Eating
Surfing
জিনিস Car
Piano
Receipt
প্রাণী Bird
Cat
Dog
গাছপালা Flower
Fruit
Vegetable
জায়গা Beach
Lake
Mountain

উদাহরণ ফলাফল

এখানে সেই সত্তাগুলির একটি উদাহরণ রয়েছে যা সহগামী ফটোতে স্বীকৃত হয়েছিল৷

ছবি: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
লেবেল 0
পাঠ্য স্টেডিয়াম
আত্মবিশ্বাস 0.9205354
লেবেল 1
পাঠ্য খেলাধুলা
আত্মবিশ্বাস 0.7531109
লেবেল 2
পাঠ্য ঘটনা
আত্মবিশ্বাস 0.66905296
লেবেল 3
পাঠ্য অবসর
আত্মবিশ্বাস 0.59904146
লেবেল 4
পাঠ্য সকার
আত্মবিশ্বাস ০.৫৬৩৮৪৫৩৪
লেবেল 5
পাঠ্য নেট
আত্মবিশ্বাস 0.54679185
লেবেল 6
পাঠ্য উদ্ভিদ
আত্মবিশ্বাস 0.524364

একটি কাস্টম টেনসরফ্লো লাইট মডেল ব্যবহার করা হচ্ছে

এমএল কিটের বেস ইমেজ লেবেলিং মডেলটি সাধারণ ব্যবহারের জন্য তৈরি করা হয়েছে। এটি 400টি বিভাগ চিনতে প্রশিক্ষিত যা ফটোতে সবচেয়ে বেশি পাওয়া বস্তুর বর্ণনা দেয়। আপনার অ্যাপ্লিকেশানের একটি বিশেষ চিত্র শ্রেণিবিন্যাসের মডেলের প্রয়োজন হতে পারে যা আরও বিস্তারিতভাবে একটি সংকীর্ণ সংখ্যক বিভাগকে স্বীকৃতি দেয়, যেমন একটি মডেল যা ফুলের প্রজাতি বা খাবারের প্রকারের মধ্যে পার্থক্য করে।

এই API আপনাকে বিস্তৃত উৎস থেকে কাস্টম ইমেজ শ্রেণীবিভাগ মডেল সমর্থন করে একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে উপযোগী করতে দেয়। আরও জানতে অনুগ্রহ করে ML কিট সহ কাস্টম মডেলগুলি পড়ুন৷ কাস্টম মডেলগুলি আপনার অ্যাপের সাথে বান্ডিল করা যেতে পারে বা ফায়ারবেস মেশিন লার্নিং এর মডেল ডিপ্লয়মেন্ট পরিষেবা ব্যবহার করে ক্লাউড থেকে গতিশীলভাবে ডাউনলোড করা যেতে পারে।

iOS অ্যান্ড্রয়েড

ইনপুট ইমেজ প্রিপ্রসেসিং

যদি প্রয়োজন হয়, ইমেজ লেবেলিং বাইলিনিয়ার ইমেজ স্কেলিং এবং স্ট্রেচিং ব্যবহার করে ইনপুট ইমেজ সাইজ এবং অ্যাসপেক্ট রেশিও সামঞ্জস্য করে যাতে সেগুলি অন্তর্নিহিত মডেলের প্রয়োজনীয়তা পূরণ করে।