ML Kit के डिजिटल इंक रिकग्निशन एपीआई की मदद से, हाथ से लिखे गए टेक्स्ट को पहचाना जा सकता है. साथ ही, डिजिटल प्लैटफ़ॉर्म पर सैकड़ों भाषाओं में हाथ के जेस्चर को अलग-अलग कैटगरी में बांटा जा सकता है. साथ ही, स्केच को अलग-अलग कैटगरी में भी बांटा जा सकता है. डिजिटल इंक पहचान एपीआई उसी टेक्नोलॉजी का इस्तेमाल करता है जो Gboard, Google Translate, और Quick, Draw! गेम में लिखावट की पहचान करने की सुविधा देती है.
डिजिटल इंक की पहचान की सुविधा की मदद से, ये काम किए जा सकते हैं:
- वर्चुअल कीबोर्ड पर टाइप करने के बजाय, स्क्रीन पर लिखें. इससे लोग, उन वर्णों को बना सकते हैं जो उनके कीबोर्ड पर उपलब्ध नहीं हैं. जैसे, लैटिन ऐल्फ़ा कीबोर्ड के लिए Player, अ या 森 का इस्तेमाल किया जा सकता है.
- जेस्चर का इस्तेमाल करके, टेक्स्ट से जुड़ी बुनियादी कार्रवाइयां (नेविगेशन, बदलाव करना, चुनना वगैरह) करें.
- हाथ से बने आकार और इमोजी पहचानें.
डिजिटल इंक की पहचान, उपयोगकर्ता के स्क्रीन पर ड्रॉ किए जाने वाले स्ट्रोक के साथ काम करती है. अगर आपको कैमरे से ली गई इमेज से टेक्स्ट पढ़ना है, तो Text Recognition API का इस्तेमाल करें.
डिजिटल इंक पहचान की सुविधा पूरी तरह ऑफ़लाइन काम करती है. यह Android और iOS पर काम करती है.
मुख्य सुविधाएं
- यह हाथ से लिखे गए टेक्स्ट को यूनिकोड वर्णों के क्रम में बदलता है
- डिवाइस पर करीब-करीब रीयल टाइम में चलती है
- उपयोगकर्ता की हैंडराइटिंग, डिवाइस पर ही सेव रहती है. पहचान की प्रोसेस बिना किसी इंटरनेट कनेक्शन के की जाती है
- यह सुविधा 300 से ज़्यादा भाषाओं और 25 से ज़्यादा भाषाओं में काम करती है.
इस्तेमाल की जा सकने वाली भाषाओं की पूरी सूची देखें
-x-gesture
एक्सटेंशन की मदद से, इन भाषाओं के लिए हाथ के जेस्चर की कैटगरी तय की जा सकती है
- यह इमोजी और सामान्य आकारों को पहचानता है
- ज़रूरत के हिसाब से डाइनैमिक तौर पर भाषा पैक डाउनलोड करके, डिवाइस का स्टोरेज कम रहता है
आइडेंटिफ़ायर, Ink
ऑब्जेक्ट को इनपुट के तौर पर इस्तेमाल करता है. उपयोगकर्ता ने स्क्रीन पर क्या लिखा है, Ink
को वेक्टर से दिखाया जाता है: यह स्ट्रोक का क्रम होता है. हर क्रम में, उस समय की जानकारी वाले कोऑर्डिनेट की सूची होती है जिसे टच पॉइंट कहते हैं. स्ट्रोक तब शुरू होता है, जब उपयोगकर्ता अपने स्टाइलस या उंगली को नीचे रखता है और ऊपर उठाने पर खत्म हो जाता है. Ink
को किसी आइडेंटिफ़ायर को भेजा जाता है, जो पहचान से जुड़े एक या उससे ज़्यादा नतीजे देता है. ये नतीजे काफ़ी भरोसेमंद होते हैं.
उदाहरण
अंग्रेज़ी हैंडराइटिंग
नीचे बाईं ओर की इमेज से पता चलता है कि उपयोगकर्ता ने स्क्रीन पर क्या बनाया. दाईं ओर दी गई इमेज, Ink
ऑब्जेक्ट से जुड़ी है. इसमें लाल बिंदुओं वाले स्ट्रोक होते हैं, जो प्रत्येक स्ट्रोक के अंदर टच पॉइंट को दर्शाते हैं.
चार स्ट्रोक होते हैं. Ink
ऑब्जेक्ट में पहले दो स्ट्रोक ऐसे दिखते हैं:
इंक | ||
---|---|---|
स्ट्रोक 1 | x
|
392, 391, 389, 287, ... |
y
|
52, 60, 76, 97, ... | |
t
|
0, 37, 56, 75, ... | |
स्ट्रोक 2 | x
|
497, 494, 493, 490, ... |
y
|
167, 165, 165, 165, ... | |
t
|
694, 742, 751, 770, ... | |
... |
जब इस Ink
को अंग्रेज़ी भाषा के पहचानकर्ता को भेजा जाता है, तो यह पांच या छह वर्णों वाले कई संभावित ट्रांसक्रिप्शन दिखाता है. ये नतीजे,
कॉन्फ़िडेंस लेवल को कम करके क्रम में लगाए जाते हैं:
RecognitionResult | |
---|---|
मान्यता पाने के लिए उम्मीदवार #1 | हैंड |
पहचान के लिए उम्मीदवार #2 | Handrw |
पहचान के लिए उम्मीदवार #3 | हार्ड्व |
पहचान उम्मीदवार #4 | Handu |
पहचान के लिए उम्मीदवार #5 | हैंडवे |
हाथ के जेस्चर
जेस्चर क्लासिफ़ायर, इंक स्ट्रोक को नीचे दी गई नौ जेस्चर क्लास में से एक में बांटता है.
arch:above arch:below |
|
caret:above caret:below |
|
circle |
|
scribble |
|
strike |
|
verticalbar |
|
writing |
इमोजी स्केच
नीचे बाईं ओर की इमेज से पता चलता है कि उपयोगकर्ता ने स्क्रीन पर क्या बनाया. दाईं ओर दी गई इमेज, Ink
ऑब्जेक्ट से जुड़ी है. इसमें लाल बिंदुओं वाले स्ट्रोक होते हैं, जो प्रत्येक स्ट्रोक के अंदर टच पॉइंट को दर्शाते हैं.
Ink
ऑब्जेक्ट में छह स्ट्रोक हैं.
इंक | ||
---|---|---|
स्ट्रोक 1 | x
|
269, 266, 262, 255, ... |
y
|
40, 40, 40, 41, ... | |
t
|
0, 36, 56, 75, ... | |
स्ट्रोक 2 | x
|
179, 182, 183, 185, ... |
y
|
157, 158, 159, 160, ... | |
t
|
2475, 2522, 2531, 2541, ... | |
... |
जब इस Ink
को इमोजी आइडेंटिफ़ायर को भेजा जाता है, तो आपको स्क्रीन पर कई तरह के ट्रांसक्रिप्शन मिलते हैं. ये लेख, उपयोगकर्ता के भरोसे को कम होते हुए क्रम में लगाए जाते हैं:
RecognitionResult | |
---|---|
मान्यता पाने के लिए उम्मीदवार #1 | 😂 (U+1f62d) |
पहचान के लिए उम्मीदवार #2 | 😅 (U+1f605) |
पहचान के लिए उम्मीदवार #3 | 😹 (U+1f639) |
पहचान उम्मीदवार #4 | 🎥 (U+1f604) |
पहचान के लिए उम्मीदवार #5 | 😆 (U+1f606) |