चेहरे की पहचान करने की सुविधा, विज़ुअल इमेज में मानव चेहरों की पहचान करती है, जैसे कि डिजिटल इमेज या वीडियो. जब किसी चेहरे का पता चलता है, तो उसकी स्थिति, साइज़, और स्क्रीन की दिशा बदली जाती है. उसे आंखों और नाक जैसी लैंडमार्क से खोजा जा सकता है.
एमएल किट में चेहरे की पहचान करने वाली सुविधा के लिए हम इन शर्तों का इस्तेमाल करते हैं:
फ़ेस ट्रैकिंग की मदद से, चेहरे की पहचान करके वीडियो के क्रम को बढ़ाया जा सकता है. किसी भी समय, किसी भी चेहरे को लंबे समय तक दिखाने के लिए, फ़्रेम से फ़्रेम को ट्रैक किया जा सकता है. इसका मतलब है कि लगातार वीडियो फ़्रेम में होने वाले चेहरे की पहचान, एक ही व्यक्ति के तौर पर की गई. ध्यान रखें कि यह चेहरे की पहचान करने का तरीका नहीं है; चेहरे की पहचान करके सिर्फ़ वीडियो के क्रम में चेहरों की स्थिति और मोशन के आधार पर अनुमान लगाया जाता है.
लैंडमार्क, चेहरे के अंदर लोकप्रिय जगह है. यह ज़रूरी है कि बाईं आंख, दाईं आंख, और नाक का बेस, लैंडमार्क के सभी उदाहरण हों. एमएल किट किसी चेहरे पर पता लगाए गए लैंडमार्क को ढूंढने की सुविधा देती है.
कॉनटूर, चेहरे की सुविधा के आकार के हिसाब से बिंदुओं का सेट होता है. एमएल किट से चेहरे का कॉन्टूर ढूंढने में मदद मिलती है.
क्लासिफ़िकेशन से यह तय होता है कि चेहरे की कोई खास विशेषता मौजूद है या नहीं. उदाहरण के लिए, किसी चेहरे की पहचान करके यह पता लगाया जा सकता है कि उसकी आंखें खुली हैं या बंद.
चेहरे का ओरिएंटेशन
नीचे दिए गए शब्द कैमरे के हिसाब से ऐंगल के हिसाब से दिखाया जाना चाहिए:
- यूलर X: सकारात्मक यूलर X कोण वाला चेहरा ऊपर की ओर होता है.
- यूलर वाई: सकारात्मक यूलर वाई ऐंगल वाला चेहरा, कैमरे की दाईं ओर देखता है या नेगेटिव होने पर बाईं ओर देखता है.
- यूलर ज़ी: यूलर ज़ेड वाले ऐंगल वाला कैमरा, घड़ी की उल्टी दिशा में घड़ी की दिशा में घुमाया जाता है.
एमएल किट, पता लगाए गए चेहरे के यूलर X, यूलर Y या यूलर Z ऐंगल से जुड़े ऐंगल की रिपोर्ट नहीं करती, जब
LANDMARK_MODE_NONE
, CONTOUR_MODE_ALL
, CLASSIFICATION_MODE_NONE
, और
PERFORMANCE_MODE_FAST
को एक साथ सेट किया गया हो.
लैंडमार्क
लैंडमार्क, चेहरे पर अपनी पसंदीदा जगह होती है. लैंडमार्क की नज़र में बाईं आंख, दायां आंख, और नोज़ बेस हैं.
एमएल किट लैंडमार्क का पता लगाए बिना, चेहरों का पता लगाता है. लैंडमार्क की पहचान करना एक वैकल्पिक चरण है. यह डिफ़ॉल्ट रूप से बंद होता है.
नीचे दी गई टेबल में उन सभी लैंडमार्क की खास जानकारी दी गई है जिनका पता, किसी जुड़े हुए चेहरे के यूलर वाई ऐंगल से दिया जा सकता है:
यूलर Y ऐंगल | लैंडमार्क की पहचान की जा सकती है |
---|---|
< -36 डिग्री | बाईं आंख, बाएं मुंह, बाएं कान, नाक का बेस, बाएं गाल |
-36 डिग्री से -12 डिग्री | बाएं मुंह, नाक का आधार, नीचे वाला मुंह, दायां आंख, बायां गाल, बाएं कान की सलाह |
-12 डिग्री से 12 डिग्री | दाईं आंख, बाएं आंख, नाक का बेस, गाल, दाएं गाल, बाएं मुंह, दायां मुंह, नीचे वाला मुंह |
12 डिग्री से 36 डिग्री | दायां मुंह, नाक का आधार, नीचे वाला मुंह, बाईं आंख, दायां आंख, गाल, दाएं कान की टिप |
> 36 डिग्री | दायां आंख, दायां मुंह, नाक का बेस, दायां गाल |
पहचानी गई हर लैंडमार्क में, इमेज से जुड़ी जगह की जानकारी शामिल होती है.
कॉनटूर
कॉन्टूर पॉइंट का एक सेट होता है जो चेहरे की बनावट के आकार को दिखाता है. नीचे दी गई इमेज से पता चलता है कि ये पॉइंट किसी चेहरे को कैसे मैप करते हैं. इमेज पर क्लिक करके, उसे बड़ा करें:
एमएल किट को पता चलने वाली हर सुविधा के लिए एक तय संख्या में पॉइंट दिखाए जाते हैं:
चेहरे का अंडाकार | 36 पॉइंट | ऊपर की ओर होंठ (ऊपर) | 11 पॉइंट |
---|---|---|---|
बाईं भौंह (ऊपर) | 5 पॉइंट | ऊपर का होठ (नीचे) | 9 पॉइंट |
बाईं भौंह (नीचे) | 5 पॉइंट | निचला होंठ | 9 पॉइंट |
दाईं भौंह (ऊपर) | 5 पॉइंट | नीचे वाला होंठ | 9 पॉइंट |
दाईं भौंह (नीचे) | 5 पॉइंट | नाक का पुल | दो पॉइंट |
बाईं आंख | 16 पॉइंट | नाक के नीचे | 3 पॉइंट |
दाईं आंख | 16 पॉइंट | ||
बाईं ओर से गाल | एक पॉइंट | ||
दायां गाल | 1 पॉइंट |
जब आपको कोई चेहरा और चेहरा सभी एक साथ मिलता है, तो आपको 133 बिंदुओं की श्रेणी मिलती है, जिसे दिखाने के लिए मैप दिखाना होता है, जैसा कि नीचे दिखाया गया है:
सुविधा के आकार के इंडेक्स | |
---|---|
0-35 | चेहरे का अंडाकार |
36-40 | बाईं भौंह (ऊपर) |
41-45 | बाईं भौंह (नीचे) |
46-50 | दाईं भौंह (ऊपर) |
51-55 | दाईं भौंह (नीचे) |
56-71 | बाईं आंख |
72-87 | दाईं आंख |
88-96 | ऊपर का होठ (नीचे) |
97-105 | निचला होंठ |
106-116 | ऊपर की ओर होंठ (ऊपर) |
117-125 | नीचे वाला होंठ |
1,26, 127 | नाक का पुल |
128-130 | नाक के नीचे (ध्यान दें कि सेंटर पॉइंट 128 पर है) |
131 | बाईं ओर से गाल |
132 | दायां गाल |
कैटगरी
क्लासिफ़िकेशन से यह तय होता है कि चेहरे की कोई खास विशेषता मौजूद है या नहीं. एमएल किट में अभी दो तरह के क्लास का इस्तेमाल किया जा सकता है: आंखें खोलें और मुस्कुराएं.
वर्गीकरण एक निश्चित मान है. इससे लोगों को यह भरोसा मिलता है कि चेहरे की पहचान करने वाला एट्रिब्यूट मौजूद है. उदाहरण के लिए, मुस्कुराते हुए किसी कैटगरी की वैल्यू 0.7 या उससे ज़्यादा रखने का मतलब है कि कोई व्यक्ति मुस्कुरा रहा है.
ये दोनों कैटगरी, लैंडमार्क की पहचान करने पर निर्भर करती हैं.
यह भी ध्यान रखें कि क्लासिफ़िकेशन और कोट;आँखों को कोटेशन; कोट और कोट करते समय; सिर्फ़ सामने वाले चेहरों के लिए काम करें. जैसे, छोटे यूलर वाई ऐंगल वाले डिसप्ले (-18 से 18 डिग्री के बीच).
चेहरे का कम से कम साइज़
चेहरे का कम से कम साइज़, आपके चेहरे का साइज़ होता है. इसे सिर की चौड़ाई और इमेज की चौड़ाई के अनुपात के तौर पर दिखाया जाता है. उदाहरण के लिए, 0.1 वैल्यू का मतलब है कि खोजे जाने वाले इमेज की चौड़ाई का करीब 10% हिस्सा सबसे छोटा चेहरा होता है.
चेहरे के साइज़ को कम से कम पर सेट करने से, परफ़ॉर्मेंस के सटीक होने की तुलना की जाती है: साइज़ को छोटा करने पर, डिटेक्टर को छोटे चेहरों की पहचान करने में मदद मिलती है. हालांकि, इमेज की पहचान करने में ज़्यादा समय लगेगा. इमेज का साइज़ बड़ा करने पर, हो सकता है कि उसके चेहरे छोटे हो जाएं, लेकिन यह तेज़ी से काम करे.
चेहरे का कम से कम साइज़ साइज़ कोई तय सीमा नहीं है. पहचान करने वाले यह पता लगा सकते हैं कि चेहरे की पहचान करने के लिए, तय किए गए साइज़ से छोटे साइज़ का इस्तेमाल किया गया है या नहीं.
अगले चरण
अपने iOS या Android ऐप्लिकेशन में चेहरे की पहचान का इस्तेमाल करें: