एमएल किट टेक्स्ट की पहचान करने की सुविधा वाला एपीआई, लैटिन वर्शन पर आधारित किसी भी वर्ण सेट में मौजूद टेक्स्ट को पहचान सकता है. इसका इस्तेमाल डेटा एंट्री से जुड़े कामों को अपने-आप करने के लिए भी किया जा सकता है, जैसे कि क्रेडिट कार्ड, रसीदें, और बिज़नेस कार्ड.
मुख्य क्षमताएं
- लैटिन-आधारित भाषाओं में टेक्स्ट की पहचान करें लैटिन स्क्रिप्ट का इस्तेमाल करके टेक्स्ट को पहचानने की सुविधा देता है
- टेक्स्ट की बनावट का विश्लेषण करें इससे शब्दों/एलिमेंट, लाइन, और पैराग्राफ़ के बारे में पता चलता है
- टेक्स्ट की भाषा की पहचान करें
- छोटे ऐप्लिकेशन फ़ुटप्रिंट: Android पर, एपीआई को Google Play सेवाओं के ज़रिए अनबंडल लाइब्रेरी के तौर पर ऑफ़र किया जाता है
- रीयल-टाइम में पहचान करना, कई तरह के डिवाइसों पर रीयल-टाइम में टेक्स्ट की पहचान करना
टेक्स्ट का स्ट्रक्चर
टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर बताना:
ब्लॉक करें, टेक्स्ट की लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,
लाइन, एक ही ऐक्सिस पर शब्दों का एक बड़ा सेट होती है, और
एलिमेंट, लैटिन भाषा में एक ही ऐक्सिस पर अक्षर और अंक (जैसे, &शब्द और कोट) का एक तय सेट होता है
ज़्यादातर लैटिन भाषाओं में एक अक्ष या अक्षर और अंक में एक ही वर्ण होता है.
नीचे दी गई इमेज, इनमें से हर एक के उदाहरण को घटते क्रम में हाइलाइट करती है. स्यान में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, नीले रंग में दिखता है. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक के तीसरे सेट को वर्ड कहते हैं.
सभी ब्लॉक किए गए ब्लॉक, लाइनों, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, और पहचानी गई भाषाएं दिखाता है.
परिणामों के उदाहरण

फ़ोटो: Dietmar Rabich, Wikimedia Networks, "Düsselford, Wege der pallamentarischan Demokratie -- 2015 -- 8123" CC BY-SA 410}
पहचाना गया टेक्स्ट | |
---|---|
टेक्स्ट | वेग डे पार्लामेंटारिसेन डेमोग्राफ़ी |
ब्लॉक | (1 ब्लॉक) |
ब्लॉक 0 | |
---|---|
टेक्स्ट | विगे डे डे पर्लामेन्टिस्चेन डेमोक्रोटी |
Frame | (296, 665 - 796, 882) |
कॉर्नर पॉइंट | (296, 719), (778, 665), (796, 828), (314, 882) |
मान्यता प्राप्त भाषा कोड | de |
लाइनें | (तीन लाइनें) |
लाइन 0 | |
---|---|
टेक्स्ट | वेज डेर |
Frame | (434, 678 - 670, 749) |
कॉर्नर पॉइंट | (434, 705), (665, 678), (670, 722), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8766741 |
घुमाव डिग्री | 6.6116457 |
एलिमेंट | (दो एलिमेंट) |
एलिमेंट 0 | |
---|---|
टेक्स्ट | वेज |
Frame | (434, 689 - 575, 749) |
कॉर्नर पॉइंट | (434, 705), (570, 689), (575, 733), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8964844 |
घुमाव डिग्री | 6.6116457 |
एलिमेंट | (चार एलिमेंट) |
सिंबल 0 | |
---|---|
टेक्स्ट | W |
Frame | (434, 698 - 500, 749) |
कॉर्नर पॉइंट | (434, 706), (495, 698), (500, 741), (439, 749) |
कॉन्फ़िडेंस स्कोर | 0.87109375 |
घुमाव डिग्री | 6.611646 |