चेहरे की पहचान से जुड़े सिद्धांत

चेहरे की पहचान करने की सुविधा, विज़ुअल इमेज में मानव चेहरों की पहचान करती है, जैसे कि डिजिटल इमेज या वीडियो. जब किसी चेहरे का पता चलता है, तो उसकी स्थिति, साइज़, और स्क्रीन की दिशा बदली जाती है. उसे आंखों और नाक जैसी लैंडमार्क से खोजा जा सकता है.

एमएल किट में चेहरे की पहचान करने वाली सुविधा के लिए हम इन शर्तों का इस्तेमाल करते हैं:

  • फ़ेस ट्रैकिंग की मदद से, चेहरे की पहचान करके वीडियो के क्रम को बढ़ाया जा सकता है. किसी भी समय, किसी भी चेहरे को लंबे समय तक दिखाने के लिए, फ़्रेम से फ़्रेम को ट्रैक किया जा सकता है. इसका मतलब है कि लगातार वीडियो फ़्रेम में होने वाले चेहरे की पहचान, एक ही व्यक्ति के तौर पर की गई. ध्यान रखें कि यह चेहरे की पहचान करने का तरीका नहीं है; चेहरे की पहचान करके सिर्फ़ वीडियो के क्रम में चेहरों की स्थिति और मोशन के आधार पर अनुमान लगाया जाता है.

  • लैंडमार्क, चेहरे के अंदर लोकप्रिय जगह है. यह ज़रूरी है कि बाईं आंख, दाईं आंख, और नाक का बेस, लैंडमार्क के सभी उदाहरण हों. एमएल किट किसी चेहरे पर पता लगाए गए लैंडमार्क को ढूंढने की सुविधा देती है.

  • कॉनटूर, चेहरे की सुविधा के आकार के हिसाब से बिंदुओं का सेट होता है. एमएल किट से चेहरे का कॉन्टूर ढूंढने में मदद मिलती है.

  • क्लासिफ़िकेशन से यह तय होता है कि चेहरे की कोई खास विशेषता मौजूद है या नहीं. उदाहरण के लिए, किसी चेहरे की पहचान करके यह पता लगाया जा सकता है कि उसकी आंखें खुली हैं या बंद.

चेहरे का ओरिएंटेशन

नीचे दिए गए शब्द कैमरे के हिसाब से ऐंगल के हिसाब से दिखाया जाना चाहिए:

  • यूलर X: सकारात्मक यूलर X कोण वाला चेहरा ऊपर की ओर होता है.
  • यूलर वाई: सकारात्मक यूलर वाई ऐंगल वाला चेहरा, कैमरे की दाईं ओर देखता है या नेगेटिव होने पर बाईं ओर देखता है.
  • यूलर ज़ी: यूलर ज़ेड वाले ऐंगल वाला कैमरा, घड़ी की उल्टी दिशा में घड़ी की दिशा में घुमाया जाता है.

एमएल किट, पता लगाए गए चेहरे के यूलर X, यूलर Y या यूलर Z ऐंगल से जुड़े ऐंगल की रिपोर्ट नहीं करती, जब LANDMARK_MODE_NONE, CONTOUR_MODE_ALL, CLASSIFICATION_MODE_NONE, और PERFORMANCE_MODE_FAST को एक साथ सेट किया गया हो.

लैंडमार्क

लैंडमार्क, चेहरे पर अपनी पसंदीदा जगह होती है. लैंडमार्क की नज़र में बाईं आंख, दायां आंख, और नोज़ बेस हैं.

एमएल किट लैंडमार्क का पता लगाए बिना, चेहरों का पता लगाता है. लैंडमार्क की पहचान करना एक वैकल्पिक चरण है. यह डिफ़ॉल्ट रूप से बंद होता है.

नीचे दी गई टेबल में उन सभी लैंडमार्क की खास जानकारी दी गई है जिनका पता, किसी जुड़े हुए चेहरे के यूलर वाई ऐंगल से दिया जा सकता है:

यूलर Y ऐंगल लैंडमार्क की पहचान की जा सकती है
< -36 डिग्री बाईं आंख, बाएं मुंह, बाएं कान, नाक का बेस, बाएं गाल
-36 डिग्री से -12 डिग्री बाएं मुंह, नाक का आधार, नीचे वाला मुंह, दायां आंख, बायां गाल, बाएं कान की सलाह
-12 डिग्री से 12 डिग्री दाईं आंख, बाएं आंख, नाक का बेस, गाल, दाएं गाल, बाएं मुंह, दायां मुंह, नीचे वाला मुंह
12 डिग्री से 36 डिग्री दायां मुंह, नाक का आधार, नीचे वाला मुंह, बाईं आंख, दायां आंख, गाल, दाएं कान की टिप
> 36 डिग्री दायां आंख, दायां मुंह, नाक का बेस, दायां गाल

पहचानी गई हर लैंडमार्क में, इमेज से जुड़ी जगह की जानकारी शामिल होती है.

कॉनटूर

कॉन्टूर पॉइंट का एक सेट होता है जो चेहरे की बनावट के आकार को दिखाता है. नीचे दी गई इमेज से पता चलता है कि ये पॉइंट किसी चेहरे को कैसे मैप करते हैं. इमेज पर क्लिक करके, उसे बड़ा करें:

एमएल किट को पता चलने वाली हर सुविधा के लिए एक तय संख्या में पॉइंट दिखाए जाते हैं:

चेहरे का अंडाकार 36 पॉइंट ऊपर की ओर होंठ (ऊपर) 11 पॉइंट
बाईं भौंह (ऊपर) 5 पॉइंट ऊपर का होठ (नीचे) 9 पॉइंट
बाईं भौंह (नीचे) 5 पॉइंट निचला होंठ 9 पॉइंट
दाईं भौंह (ऊपर) 5 पॉइंट नीचे वाला होंठ 9 पॉइंट
दाईं भौंह (नीचे) 5 पॉइंट नाक का पुल दो पॉइंट
बाईं आंख 16 पॉइंट नाक के नीचे 3 पॉइंट
दाईं आंख 16 पॉइंट
बाईं ओर से गाल एक पॉइंट
दायां गाल 1 पॉइंट

जब आपको कोई चेहरा और चेहरा सभी एक साथ मिलता है, तो आपको 133 बिंदुओं की श्रेणी मिलती है, जिसे दिखाने के लिए मैप दिखाना होता है, जैसा कि नीचे दिखाया गया है:

सुविधा के आकार के इंडेक्स
0-35 चेहरे का अंडाकार
36-40 बाईं भौंह (ऊपर)
41-45 बाईं भौंह (नीचे)
46-50 दाईं भौंह (ऊपर)
51-55 दाईं भौंह (नीचे)
56-71 बाईं आंख
72-87 दाईं आंख
88-96 ऊपर का होठ (नीचे)
97-105 निचला होंठ
106-116 ऊपर की ओर होंठ (ऊपर)
117-125 नीचे वाला होंठ
1,26, 127 नाक का पुल
128-130 नाक के नीचे (ध्यान दें कि सेंटर पॉइंट 128 पर है)
131 बाईं ओर से गाल
132 दायां गाल

कैटगरी

क्लासिफ़िकेशन से यह तय होता है कि चेहरे की कोई खास विशेषता मौजूद है या नहीं. एमएल किट में अभी दो तरह के क्लास का इस्तेमाल किया जा सकता है: आंखें खोलें और मुस्कुराएं.

वर्गीकरण एक निश्चित मान है. इससे लोगों को यह भरोसा मिलता है कि चेहरे की पहचान करने वाला एट्रिब्यूट मौजूद है. उदाहरण के लिए, मुस्कुराते हुए किसी कैटगरी की वैल्यू 0.7 या उससे ज़्यादा रखने का मतलब है कि कोई व्यक्ति मुस्कुरा रहा है.

ये दोनों कैटगरी, लैंडमार्क की पहचान करने पर निर्भर करती हैं.

यह भी ध्यान रखें कि क्लासिफ़िकेशन और कोट;आँखों को कोटेशन; कोट और कोट करते समय; सिर्फ़ सामने वाले चेहरों के लिए काम करें. जैसे, छोटे यूलर वाई ऐंगल वाले डिसप्ले (-18 से 18 डिग्री के बीच).

चेहरे का कम से कम साइज़

चेहरे का कम से कम साइज़, आपके चेहरे का साइज़ होता है. इसे सिर की चौड़ाई और इमेज की चौड़ाई के अनुपात के तौर पर दिखाया जाता है. उदाहरण के लिए, 0.1 वैल्यू का मतलब है कि खोजे जाने वाले इमेज की चौड़ाई का करीब 10% हिस्सा सबसे छोटा चेहरा होता है.

चेहरे के साइज़ को कम से कम पर सेट करने से, परफ़ॉर्मेंस के सटीक होने की तुलना की जाती है: साइज़ को छोटा करने पर, डिटेक्टर को छोटे चेहरों की पहचान करने में मदद मिलती है. हालांकि, इमेज की पहचान करने में ज़्यादा समय लगेगा. इमेज का साइज़ बड़ा करने पर, हो सकता है कि उसके चेहरे छोटे हो जाएं, लेकिन यह तेज़ी से काम करे.

चेहरे का कम से कम साइज़ साइज़ कोई तय सीमा नहीं है. पहचान करने वाले यह पता लगा सकते हैं कि चेहरे की पहचान करने के लिए, तय किए गए साइज़ से छोटे साइज़ का इस्तेमाल किया गया है या नहीं.

अगले चरण

अपने iOS या Android ऐप्लिकेशन में चेहरे की पहचान का इस्तेमाल करें: