মুখ সনাক্তকরণ ধারণা

মুখ সনাক্তকরণ ভিজ্যুয়াল মিডিয়া যেমন ডিজিটাল ছবি বা ভিডিওতে মানুষের মুখ সনাক্ত করে। যখন একটি মুখ সনাক্ত করা হয় তখন এটির একটি যুক্ত অবস্থান, আকার এবং অভিযোজন থাকে; এবং এটি চোখ এবং নাকের মতো ল্যান্ডমার্কের জন্য অনুসন্ধান করা যেতে পারে।

ML Kit-এর মুখ শনাক্তকরণ বৈশিষ্ট্য সম্পর্কে আমরা ব্যবহার করি এমন কিছু শর্ত এখানে রয়েছে:

  • ফেস ট্র্যাকিং ভিডিও সিকোয়েন্সে মুখ সনাক্তকরণকে প্রসারিত করে। যে কোনও মুখ যা কোনও ভিডিওতে যে কোনও দৈর্ঘ্যের জন্য প্রদর্শিত হয় তা ফ্রেম থেকে ফ্রেমে ট্র্যাক করা যেতে পারে। এর মানে একটানা ভিডিও ফ্রেমে শনাক্ত করা একটি মুখ একই ব্যক্তি হিসেবে চিহ্নিত করা যেতে পারে। মনে রাখবেন যে এটি মুখ শনাক্তকরণের একটি ফর্ম নয়; ফেস ট্র্যাকিং শুধুমাত্র একটি ভিডিও সিকোয়েন্সে মুখের অবস্থান এবং গতির উপর ভিত্তি করে অনুমান করে।

  • একটি ল্যান্ডমার্ক একটি মুখের মধ্যে একটি আগ্রহের বিন্দু. বাম চোখ, ডান চোখ এবং নাকের গোড়া সবই ল্যান্ডমার্কের উদাহরণ। এমএল কিট একটি সনাক্ত করা মুখের উপর ল্যান্ডমার্ক খুঁজে পাওয়ার ক্ষমতা প্রদান করে।

  • একটি কনট্যুর হল পয়েন্টগুলির একটি সেট যা একটি মুখের বৈশিষ্ট্যের আকৃতি অনুসরণ করে। এমএল কিট একটি মুখের কনট্যুর খুঁজে বের করার ক্ষমতা প্রদান করে।

  • শ্রেণীবিভাগ একটি নির্দিষ্ট মুখের বৈশিষ্ট্য উপস্থিত কিনা তা নির্ধারণ করে। উদাহরণস্বরূপ, একটি মুখের চোখ খোলা বা বন্ধ, বা মুখটি হাসছে কিনা তা দ্বারা শ্রেণিবদ্ধ করা যেতে পারে।

মুখের অভিযোজন

নিচের পদগুলি ক্যামেরার সাপেক্ষে একটি মুখ যে কোণে অবস্থিত তা বর্ণনা করে:

  • অয়লার এক্স : একটি ধনাত্মক অয়লার এক্স কোণ বিশিষ্ট একটি মুখ উপরের দিকে মুখ করে থাকে।
  • অয়লার ওয়াই : একটি ইতিবাচক অয়লার ওয়াই কোণ সহ একটি মুখ ক্যামেরার ডানদিকে তাকিয়ে আছে, বা নেতিবাচক হলে বাম দিকে তাকাচ্ছে।
  • অয়লার জেড : ইতিবাচক অয়লার জেড কোণ সহ একটি মুখ ক্যামেরার সাপেক্ষে ঘড়ির কাঁটার বিপরীত দিকে ঘোরানো হয়।

LANDMARK_MODE_NONE , CONTOUR_MODE_ALL , CLASSIFICATION_MODE_NONE এবং PERFORMANCE_MODE_FAST একসাথে সেট করা থাকলে ML কিট সনাক্ত করা মুখের অয়লার X, অয়লার Y বা অয়লার Z কোণ রিপোর্ট করে না।

ল্যান্ডমার্ক

একটি ল্যান্ডমার্ক একটি মুখের মধ্যে একটি আগ্রহের বিন্দু. বাম চোখ, ডান চোখ, এবং নাকের বেস সমস্ত ল্যান্ডমার্কের উদাহরণ।

ML কিট ল্যান্ডমার্ক না খুঁজছেন মুখ সনাক্ত. ল্যান্ডমার্ক সনাক্তকরণ একটি ঐচ্ছিক পদক্ষেপ যা ডিফল্টরূপে অক্ষম করা হয়।

নিম্নলিখিত সারণীটি সমস্ত ল্যান্ডমার্কগুলির সংক্ষিপ্ত বিবরণ দেয় যা একটি সম্পর্কিত মুখের অয়লার ওয়াই কোণে সনাক্ত করা যেতে পারে:

অয়লার ওয়াই কোণ সনাক্তযোগ্য ল্যান্ডমার্ক
<-36 ডিগ্রি বাম চোখ, বাম মুখ, বাম কান, নাকের গোড়া, বাম গাল
-36 ডিগ্রী থেকে -12 ডিগ্রী বাম মুখ, নাকের গোড়া, নীচের মুখ, ডান চোখ, বাম চোখ, বাম গাল, বাম কানের ডগা
-12 ডিগ্রী থেকে 12 ডিগ্রী ডান চোখ, বাম চোখ, নাকের গোড়া, বাম গাল, ডান গাল, বাম মুখ, ডান মুখ, নীচের মুখ
12 ডিগ্রী থেকে 36 ডিগ্রী ডান মুখ, নাকের গোড়া, নীচের মুখ, বাম চোখ, ডান চোখ, ডান গাল, ডান কানের ডগা
> 36 ডিগ্রি ডান চোখ, ডান মুখ, ডান কান, নাকের গোড়া, ডান গাল

প্রতিটি শনাক্ত করা ল্যান্ডমার্ক ছবিতে এর সংশ্লিষ্ট অবস্থান অন্তর্ভুক্ত করে।

কনট্যুরস

একটি কনট্যুর হল বিন্দুগুলির একটি সেট যা মুখের বৈশিষ্ট্যের আকারকে প্রতিনিধিত্ব করে। নিম্নলিখিত চিত্রটি ব্যাখ্যা করে যে এই পয়েন্টগুলি কীভাবে একটি মুখের সাথে মানচিত্র করে। এটি সম্প্রসারিত ইমেজ ক্লিক করুন:

প্রতিটি বৈশিষ্ট্যের কনট্যুর যা ML কিট সনাক্ত করে একটি নির্দিষ্ট সংখ্যক পয়েন্ট দ্বারা প্রতিনিধিত্ব করা হয়:

মুখ ডিম্বাকৃতি 36 পয়েন্ট উপরের ঠোঁট (শীর্ষ) 11 পয়েন্ট
বাম ভ্রু (উপরে) 5 পয়েন্ট উপরের ঠোঁট (নীচে) 9 পয়েন্ট
বাম ভ্রু (নীচে) 5 পয়েন্ট নীচের ঠোঁট (শীর্ষ) 9 পয়েন্ট
ডান ভ্রু (উপরে) 5 পয়েন্ট নিচের ঠোঁট (নীচে) 9 পয়েন্ট
ডান ভ্রু (নীচে) 5 পয়েন্ট নাকের ব্রিজ 2 পয়েন্ট
বাম চোখ 16 পয়েন্ট নাকের নীচে 3 পয়েন্ট
ডান চোখ 16 পয়েন্ট
বাম গাল (মাঝখানে) 1 পয়েন্ট
ডান গাল (মাঝখানে) 1 পয়েন্ট

আপনি যখন একটি মুখের সমস্ত কনট্যুর একবারে পেয়ে যান, তখন আপনি 133 পয়েন্টের একটি অ্যারে পাবেন, যা নিচের দেখানো মত কনট্যুরগুলিকে বৈশিষ্ট্যযুক্ত করতে মানচিত্রে:

বৈশিষ্ট্য কনট্যুর সূচী
0-35 মুখ ডিম্বাকৃতি
36-40 বাম ভ্রু (উপরে)
41-45 বাম ভ্রু (নীচে)
46-50 ডান ভ্রু (উপরে)
51-55 ডান ভ্রু (নীচে)
56-71 বাম চোখ
72-87 ডান চোখ
88-96 উপরের ঠোঁট (নীচে)
97-105 নীচের ঠোঁট (শীর্ষ)
106-116 উপরের ঠোঁট (শীর্ষ)
117-125 নিচের ঠোঁট (নীচে)
126, 127 নাকের ব্রিজ
128-130 নাকের নীচে (মনে রাখবেন যে কেন্দ্র বিন্দুটি সূচক 128 এ রয়েছে)
131 বাম গাল (মাঝখানে)
132 ডান গাল (মাঝখানে)

শ্রেণীবিভাগ

শ্রেণীবিভাগ একটি নির্দিষ্ট মুখের বৈশিষ্ট্য উপস্থিত কিনা তা নির্ধারণ করে। এমএল কিট বর্তমানে দুটি শ্রেণীবিভাগ সমর্থন করে: চোখ খোলা এবং হাসছে

শ্রেণীবিভাগ একটি নিশ্চিত মান। এটি আত্মবিশ্বাস নির্দেশ করে যে একটি মুখের বৈশিষ্ট্য উপস্থিত রয়েছে। উদাহরণস্বরূপ, স্মাইলিং শ্রেণীবিভাগের জন্য 0.7 বা তার বেশি মান নির্দেশ করে যে এটি সম্ভবত একজন ব্যক্তি হাসছে।

এই উভয় শ্রেণীবিভাগই ল্যান্ডমার্ক সনাক্তকরণের উপর নির্ভর করে।

এছাড়াও মনে রাখবেন যে "চোখ খোলা" এবং "হাসি" শ্রেণীবিভাগগুলি শুধুমাত্র সামনের মুখগুলির জন্য কাজ করে, অর্থাৎ, একটি ছোট অয়লার ওয়াই কোণযুক্ত মুখ (-18 এবং 18 ডিগ্রির মধ্যে)।

ন্যূনতম মুখের আকার

ন্যূনতম মুখের আকার হল কাঙ্খিত মুখের আকার, মাথার প্রস্থ এবং ছবির প্রস্থের অনুপাত হিসাবে প্রকাশ করা হয়৷ উদাহরণ স্বরূপ, 0.1 এর মান মানে হল অনুসন্ধান করার জন্য সবচেয়ে ছোট মুখটি অনুসন্ধান করা ছবির প্রস্থের প্রায় 10%।

ন্যূনতম মুখের আকার হল পারফরম্যান্স বনাম সঠিকতা ট্রেড-অফ: ন্যূনতম আকার ছোট সেট করা ডিটেক্টরকে ছোট মুখগুলি খুঁজে পেতে দেয় কিন্তু সনাক্তকরণে আরও বেশি সময় লাগবে; এটিকে বড় করে সেট করলে ছোট মুখগুলি বাদ দিতে পারে কিন্তু দ্রুত চলবে৷

ন্যূনতম মুখের আকার একটি কঠিন সীমা নয়; ডিটেক্টর নির্দিষ্ট করা থেকে সামান্য ছোট মুখ খুঁজে পেতে পারে।

পরবর্তী পদক্ষেপ

আপনার iOS বা Android অ্যাপে ফেস ডিটেকশন ব্যবহার করুন: