टेक्स्ट की पहचान करने की सुविधा

एमएल किट टेक्स्ट की पहचान करने की सुविधा वाला एपीआई, लैटिन वर्शन पर आधारित किसी भी वर्ण सेट में मौजूद टेक्स्ट को पहचान सकता है. इसका इस्तेमाल डेटा एंट्री से जुड़े कामों को अपने-आप करने के लिए भी किया जा सकता है, जैसे कि क्रेडिट कार्ड, रसीदें, और बिज़नेस कार्ड.

iOS Android

मुख्य क्षमताएं

  • लैटिन-आधारित भाषाओं में टेक्स्ट की पहचान करें लैटिन स्क्रिप्ट का इस्तेमाल करके टेक्स्ट को पहचानने की सुविधा देता है
  • टेक्स्ट की बनावट का विश्लेषण करें इससे शब्दों/एलिमेंट, लाइन, और पैराग्राफ़ के बारे में पता चलता है
  • टेक्स्ट की भाषा की पहचान करें
  • छोटे ऐप्लिकेशन फ़ुटप्रिंट: Android पर, एपीआई को Google Play सेवाओं के ज़रिए अनबंडल लाइब्रेरी के तौर पर ऑफ़र किया जाता है
  • रीयल-टाइम में पहचान करना, कई तरह के डिवाइसों पर रीयल-टाइम में टेक्स्ट की पहचान करना

टेक्स्ट का स्ट्रक्चर

टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर बताना:

  • ब्लॉक करें, टेक्स्ट की लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,

  • लाइन, एक ही ऐक्सिस पर शब्दों का एक बड़ा सेट होती है, और

  • एलिमेंट, लैटिन भाषा में एक ही ऐक्सिस पर अक्षर और अंक (जैसे, &शब्द और कोट) का एक तय सेट होता है

  • ज़्यादातर लैटिन भाषाओं में एक अक्ष या अक्षर और अंक में एक ही वर्ण होता है.

नीचे दी गई इमेज, इनमें से हर एक के उदाहरण को घटते क्रम में हाइलाइट करती है. स्यान में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, नीले रंग में दिखता है. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक के तीसरे सेट को वर्ड कहते हैं.

सभी ब्लॉक किए गए ब्लॉक, लाइनों, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, और पहचानी गई भाषाएं दिखाता है.

परिणामों के उदाहरण


फ़ोटो: Dietmar Rabich, Wikimedia Networks, "Düsselford, Wege der pallamentarischan Demokratie -- 2015 -- 8123" CC BY-SA 410}
पहचाना गया टेक्स्ट
टेक्स्ट वेग
डे पार्लामेंटारिसेन
डेमोग्राफ़ी
ब्लॉक (1 ब्लॉक)
ब्लॉक 0
टेक्स्ट विगे डे डे पर्लामेन्टिस्चेन डेमोक्रोटी
Frame (296, 665 - 796, 882)
कॉर्नर पॉइंट (296, 719), (778, 665), (796, 828), (314, 882)
मान्यता प्राप्त भाषा कोड de
लाइनें (तीन लाइनें)
लाइन 0
टेक्स्ट वेज डेर
Frame (434, 678 - 670, 749)
कॉर्नर पॉइंट (434, 705), (665, 678), (670, 722), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8766741
घुमाव डिग्री 6.6116457
एलिमेंट (दो एलिमेंट)
एलिमेंट 0
टेक्स्ट वेज
Frame (434, 689 - 575, 749)
कॉर्नर पॉइंट (434, 705), (570, 689), (575, 733), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8964844
घुमाव डिग्री 6.6116457
एलिमेंट (चार एलिमेंट)
सिंबल 0
टेक्स्ट W
Frame (434, 698 - 500, 749)
कॉर्नर पॉइंट (434, 706), (495, 698), (500, 741), (439, 749)
कॉन्फ़िडेंस स्कोर 0.87109375
घुमाव डिग्री 6.611646

जब तक कुछ अलग से न बताया जाए, तब तक इस पेज की सामग्री को Creative Commons Attribution 4.0 License के तहत और कोड के नमूनों को Apache 2.0 License के तहत लाइसेंस मिला है. ज़्यादा जानकारी के लिए, Google Developers साइट नीतियां देखें. Oracle और/या इससे जुड़ी हुई कंपनियों का, Java एक रजिस्टर किया हुआ ट्रेडमार्क है.

आखिरी बार 2023-02-01 (UTC) को अपडेट किया गया.