ML Kit टेक्स्ट पहचान v2 एपीआई, किसी भी चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन कैरेक्टर सेट के टेक्स्ट की पहचान कर सकता है. इस एपीआई का इस्तेमाल, डेटा एंट्री के टास्क को ऑटोमेट करने के लिए भी किया जा सकता है. जैसे, क्रेडिट कार्ड, रसीदों, और बिज़नेस कार्ड को प्रोसेस करना.
मुख्य सुविधाएं
- अलग-अलग स्क्रिप्ट और भाषाओं में टेक्स्ट की पहचान करें चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन स्क्रिप्ट में टेक्स्ट की पहचान करने में मदद करता है
- टेक्स्ट के स्ट्रक्चर का विश्लेषण करता है. इससे सिंबल, एलिमेंट, लाइनों, और पैराग्राफ़ का पता लगाया जा सकता है
- टेक्स्ट की भाषा पहचानें इससे पहचाने गए टेक्स्ट की भाषा की पहचान होती है
- रीयल-टाइम में पहचान करने की सुविधा कई डिवाइसों पर, रीयल टाइम में टेक्स्ट की पहचान कर सकती है.
टेक्स्ट स्ट्रक्चर
टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर कहें:
ब्लॉक करें, टेक्स्ट लाइनों का एक कंक्रीट सेट होता है, जैसे कि पैराग्राफ़ या कॉलम.
लाइन, एक ही ऐक्सिस पर शब्दों का मिला-जुला सेट होती है और
एलिमेंट, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर अक्षर और अंक ("शब्द") का एक साथ मिलकर बना सेट होता है. इसी तरह, अन्य भाषाओं में एक शब्द भी होता है
सिंबल, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर एक अक्षर और अंक वाला वर्ण होता है. इसके अलावा, अन्य भाषाओं में एक वर्ण
नीचे दी गई इमेज में, इनमें से हर एक उदाहरण को घटते हुए क्रम में हाइलाइट किया गया है. स्यान रंग में हाइलाइट किया गया पहला ब्लॉक, टेक्स्ट का एक ब्लॉक है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, टेक्स्ट की लाइन हैं. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक का तीसरा सेट, शब्द हैं.
पता लगाए गए सभी ब्लॉक, लाइन, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, पहचानी गई भाषाएं, और मान्य टेक्स्ट दिखाता है.
परिणामों के उदाहरण
पहचाना गया टेक्स्ट | |
---|---|
टेक्स्ट | वेगे देर पार्लमेंटारिस्चन डेमोक्रेटी |
ब्लॉक | (1 ब्लॉक) |
ब्लॉक 0 | |
---|---|
टेक्स्ट | वेगे डेर पार्लामेंटारिस्चन डेमोक्रेटी |
Frame | (296, 665 - 796, 882) |
कॉर्नर पॉइंट | (296, 719), (778, 665), (796, 828), (314, 882) |
मान्यता प्राप्त भाषा कोड | de |
लाइनें | (3 लाइन) |
लाइन 0 | |
---|---|
टेक्स्ट | वेगे डेर |
Frame | (434, 678 - 670, 749) |
कॉर्नर पॉइंट | (434, 705), (665, 678), (670, 722), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8766741 |
रोटेशन डिग्री | -6.6116457 |
एलिमेंट | (2 एलिमेंट) |
एलिमेंट 0 | |
---|---|
टेक्स्ट | वेगे |
Frame | (434, 689 - 575, 749) |
कॉर्नर पॉइंट | (434, 705), (570, 689), (575, 733), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8964844 |
रोटेशन डिग्री | -6.6116457 |
एलिमेंट | (4 एलिमेंट) |
प्रतीक 0 | |
---|---|
टेक्स्ट | W |
Frame | (434, 698 - 500, 749) |
कॉर्नर पॉइंट | (434, 706), (495, 698), (500, 741), (439, 749) |
कॉन्फ़िडेंस स्कोर | 0.87109375 |
रोटेशन डिग्री | -6.611646 |