डिजिटल इंक की पहचान करना

ML Kit के डिजिटल इंक रिकग्निशन एपीआई की मदद से, हाथ से लिखे गए टेक्स्ट को पहचाना जा सकता है. साथ ही, डिजिटल प्लैटफ़ॉर्म पर सैकड़ों भाषाओं में हाथ के जेस्चर को अलग-अलग कैटगरी में बांटा जा सकता है. साथ ही, स्केच को अलग-अलग कैटगरी में भी बांटा जा सकता है. डिजिटल इंक पहचान एपीआई उसी टेक्नोलॉजी का इस्तेमाल करता है जो Gboard, Google Translate, और Quick, Draw! गेम में लिखावट की पहचान करने की सुविधा देती है.

डिजिटल इंक की पहचान की सुविधा की मदद से, ये काम किए जा सकते हैं:

  • वर्चुअल कीबोर्ड पर टाइप करने के बजाय, स्क्रीन पर लिखें. इससे लोग, उन वर्णों को बना सकते हैं जो उनके कीबोर्ड पर उपलब्ध नहीं हैं. जैसे, लैटिन ऐल्फ़ा कीबोर्ड के लिए Player, अ या 森 का इस्तेमाल किया जा सकता है.
  • जेस्चर का इस्तेमाल करके, टेक्स्ट से जुड़ी बुनियादी कार्रवाइयां (नेविगेशन, बदलाव करना, चुनना वगैरह) करें.
  • हाथ से बने आकार और इमोजी पहचानें.

डिजिटल इंक की पहचान, उपयोगकर्ता के स्क्रीन पर ड्रॉ किए जाने वाले स्ट्रोक के साथ काम करती है. अगर आपको कैमरे से ली गई इमेज से टेक्स्ट पढ़ना है, तो Text Recognition API का इस्तेमाल करें.

डिजिटल इंक पहचान की सुविधा पूरी तरह ऑफ़लाइन काम करती है. यह Android और iOS पर काम करती है.

iOS Android

मुख्य सुविधाएं

  • यह हाथ से लिखे गए टेक्स्ट को यूनिकोड वर्णों के क्रम में बदलता है
  • डिवाइस पर करीब-करीब रीयल टाइम में चलती है
  • उपयोगकर्ता की हैंडराइटिंग, डिवाइस पर ही सेव रहती है. पहचान की प्रोसेस बिना किसी इंटरनेट कनेक्शन के की जाती है
  • यह सुविधा 300 से ज़्यादा भाषाओं और 25 से ज़्यादा भाषाओं में काम करती है. इस्तेमाल की जा सकने वाली भाषाओं की पूरी सूची देखें
    • -x-gesture एक्सटेंशन की मदद से, इन भाषाओं के लिए हाथ के जेस्चर की कैटगरी तय की जा सकती है
  • यह इमोजी और सामान्य आकारों को पहचानता है
  • ज़रूरत के हिसाब से डाइनैमिक तौर पर भाषा पैक डाउनलोड करके, डिवाइस का स्टोरेज कम रहता है

आइडेंटिफ़ायर, Ink ऑब्जेक्ट को इनपुट के तौर पर इस्तेमाल करता है. उपयोगकर्ता ने स्क्रीन पर क्या लिखा है, Ink को वेक्टर से दिखाया जाता है: यह स्ट्रोक का क्रम होता है. हर क्रम में, उस समय की जानकारी वाले कोऑर्डिनेट की सूची होती है जिसे टच पॉइंट कहते हैं. स्ट्रोक तब शुरू होता है, जब उपयोगकर्ता अपने स्टाइलस या उंगली को नीचे रखता है और ऊपर उठाने पर खत्म हो जाता है. Ink को किसी आइडेंटिफ़ायर को भेजा जाता है, जो पहचान से जुड़े एक या उससे ज़्यादा नतीजे देता है. ये नतीजे काफ़ी भरोसेमंद होते हैं.

उदाहरण

अंग्रेज़ी हैंडराइटिंग

नीचे बाईं ओर की इमेज से पता चलता है कि उपयोगकर्ता ने स्क्रीन पर क्या बनाया. दाईं ओर दी गई इमेज, Ink ऑब्जेक्ट से जुड़ी है. इसमें लाल बिंदुओं वाले स्ट्रोक होते हैं, जो प्रत्येक स्ट्रोक के अंदर टच पॉइंट को दर्शाते हैं.

    

चार स्ट्रोक होते हैं. Ink ऑब्जेक्ट में पहले दो स्ट्रोक ऐसे दिखते हैं:

इंक
स्ट्रोक 1 x 392, 391, 389, 287, ...
y 52, 60, 76, 97, ...
t 0, 37, 56, 75, ...
स्ट्रोक 2 x 497, 494, 493, 490, ...
y 167, 165, 165, 165, ...
t 694, 742, 751, 770, ...
...

जब इस Ink को अंग्रेज़ी भाषा के पहचानकर्ता को भेजा जाता है, तो यह पांच या छह वर्णों वाले कई संभावित ट्रांसक्रिप्शन दिखाता है. ये नतीजे, कॉन्फ़िडेंस लेवल को कम करके क्रम में लगाए जाते हैं:

RecognitionResult
मान्यता पाने के लिए उम्मीदवार #1 हैंड
पहचान के लिए उम्मीदवार #2 Handrw
पहचान के लिए उम्मीदवार #3 हार्ड्व
पहचान उम्मीदवार #4 Handu
पहचान के लिए उम्मीदवार #5 हैंडवे

हाथ के जेस्चर

जेस्चर क्लासिफ़ायर, इंक स्ट्रोक को नीचे दी गई नौ जेस्चर क्लास में से एक में बांटता है.

हाथ के जेस्चर उदाहरण
arch:above
arch:below
caret:above
caret:below
circle
कॉर्नर:डाउनलेफ़्ट
scribble
strike
verticalbar
writing

इमोजी स्केच

नीचे बाईं ओर की इमेज से पता चलता है कि उपयोगकर्ता ने स्क्रीन पर क्या बनाया. दाईं ओर दी गई इमेज, Ink ऑब्जेक्ट से जुड़ी है. इसमें लाल बिंदुओं वाले स्ट्रोक होते हैं, जो प्रत्येक स्ट्रोक के अंदर टच पॉइंट को दर्शाते हैं.

    

Ink ऑब्जेक्ट में छह स्ट्रोक हैं.

           

इंक
स्ट्रोक 1 x 269, 266, 262, 255, ...
y 40, 40, 40, 41, ...
t 0, 36, 56, 75, ...
स्ट्रोक 2 x 179, 182, 183, 185, ...
y 157, 158, 159, 160, ...
t 2475, 2522, 2531, 2541, ...
...

जब इस Ink को इमोजी आइडेंटिफ़ायर को भेजा जाता है, तो आपको स्क्रीन पर कई तरह के ट्रांसक्रिप्शन मिलते हैं. ये लेख, उपयोगकर्ता के भरोसे को कम होते हुए क्रम में लगाए जाते हैं:

RecognitionResult
मान्यता पाने के लिए उम्मीदवार #1 😂 (U+1f62d)
पहचान के लिए उम्मीदवार #2 😅 (U+1f605)
पहचान के लिए उम्मीदवार #3 😹 (U+1f639)
पहचान उम्मीदवार #4 🎥 (U+1f604)
पहचान के लिए उम्मीदवार #5 😆 (U+1f606)