टेक्स्ट की पहचान v2

ML Kit टेक्स्ट पहचान v2 एपीआई, किसी भी चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन कैरेक्टर सेट के टेक्स्ट की पहचान कर सकता है. इस एपीआई का इस्तेमाल, डेटा एंट्री के टास्क को ऑटोमेट करने के लिए भी किया जा सकता है. जैसे, क्रेडिट कार्ड, रसीदों, और बिज़नेस कार्ड को प्रोसेस करना.

iOS Android

मुख्य सुविधाएं

  • अलग-अलग स्क्रिप्ट और भाषाओं में टेक्स्ट की पहचान करें चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन स्क्रिप्ट में टेक्स्ट की पहचान करने में मदद करता है
  • टेक्स्ट के स्ट्रक्चर का विश्लेषण करता है. इससे सिंबल, एलिमेंट, लाइनों, और पैराग्राफ़ का पता लगाया जा सकता है
  • टेक्स्ट की भाषा पहचानें इससे पहचाने गए टेक्स्ट की भाषा की पहचान होती है
  • रीयल-टाइम में पहचान करने की सुविधा कई डिवाइसों पर, रीयल टाइम में टेक्स्ट की पहचान कर सकती है.

टेक्स्ट स्ट्रक्चर

टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर कहें:

  • ब्लॉक करें, टेक्स्ट लाइनों का एक कंक्रीट सेट होता है, जैसे कि पैराग्राफ़ या कॉलम.

  • लाइन, एक ही ऐक्सिस पर शब्दों का मिला-जुला सेट होती है और

  • एलिमेंट, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर अक्षर और अंक ("शब्द") का एक साथ मिलकर बना सेट होता है. इसी तरह, अन्य भाषाओं में एक शब्द भी होता है

  • सिंबल, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर एक अक्षर और अंक वाला वर्ण होता है. इसके अलावा, अन्य भाषाओं में एक वर्ण

नीचे दी गई इमेज में, इनमें से हर एक उदाहरण को घटते हुए क्रम में हाइलाइट किया गया है. स्यान रंग में हाइलाइट किया गया पहला ब्लॉक, टेक्स्ट का एक ब्लॉक है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, टेक्स्ट की लाइन हैं. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक का तीसरा सेट, शब्द हैं.

पता लगाए गए सभी ब्लॉक, लाइन, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, पहचानी गई भाषाएं, और मान्य टेक्स्ट दिखाता है.

परिणामों के उदाहरण


फ़ोटो: डीटमार रेबिच, विकिमीडिया कॉमन्स, "डुसलडॉर्फ़, Wege der parlamentarischen डेमोक्रेटी -- 2015 -- 8123", CC BY-SA 4.0
पहचाना गया टेक्स्ट
टेक्स्ट वेगे
देर पार्लमेंटारिस्चन
डेमोक्रेटी
ब्लॉक (1 ब्लॉक)
ब्लॉक 0
टेक्स्ट वेगे डेर पार्लामेंटारिस्चन डेमोक्रेटी
Frame (296, 665 - 796, 882)
कॉर्नर पॉइंट (296, 719), (778, 665), (796, 828), (314, 882)
मान्यता प्राप्त भाषा कोड de
लाइनें (3 लाइन)
लाइन 0
टेक्स्ट वेगे डेर
Frame (434, 678 - 670, 749)
कॉर्नर पॉइंट (434, 705), (665, 678), (670, 722), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8766741
रोटेशन डिग्री -6.6116457
एलिमेंट (2 एलिमेंट)
एलिमेंट 0
टेक्स्ट वेगे
Frame (434, 689 - 575, 749)
कॉर्नर पॉइंट (434, 705), (570, 689), (575, 733), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8964844
रोटेशन डिग्री -6.6116457
एलिमेंट (4 एलिमेंट)
प्रतीक 0
टेक्स्ट W
Frame (434, 698 - 500, 749)
कॉर्नर पॉइंट (434, 706), (495, 698), (500, 741), (439, 749)
कॉन्फ़िडेंस स्कोर 0.87109375
रोटेशन डिग्री -6.611646