ML Kit Text Recognition v2 API สามารถจดจำข้อความในชุดอักขระจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน นอกจากนี้ API ยังนำมาใช้เพื่อดำเนินงานป้อนข้อมูลโดยอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตรได้ด้วย
ความสามารถหลัก
- จดจำข้อความในสคริปต์และภาษาต่างๆ รองรับการจดจำข้อความในตัวอักษรจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน
- วิเคราะห์โครงสร้างข้อความ รองรับการตรวจหาสัญลักษณ์ องค์ประกอบ บรรทัด และย่อหน้า
- ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
- การจดจำแบบเรียลไทม์ จดจำข้อความแบบเรียลไทม์ในอุปกรณ์ที่หลากหลายได้
โครงสร้างข้อความ
โปรแกรมจดจำข้อความจะแบ่งข้อความออกเป็นบล็อก เส้น องค์ประกอบ และสัญลักษณ์ กล่าวโดยคร่าวๆ:
บล็อกคือชุดบรรทัดข้อความต่อเนื่องกัน เช่น ย่อหน้าหรือคอลัมน์
เส้นคือชุดคำต่อกันบนแกนเดียวกัน และ
องค์ประกอบคือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("คำ") ที่อยู่ติดกันบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคำอื่นๆ
สัญลักษณ์คืออักขระที่เป็นตัวอักษรและตัวเลขคละกัน 1 ตัวบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระอื่นๆ
รูปภาพด้านล่างจะไฮไลต์ตัวอย่างของแต่ละตัวเลือกจากมากไปหาน้อย บล็อกแรกที่ไฮไลต์ด้วยสีฟ้าคือบล็อกข้อความ บล็อกไฮไลต์ชุดที่ 2 สีฟ้าคือ บรรทัดข้อความ สุดท้าย บล็อกที่ 3 ที่ไฮไลต์ใน สีน้ำเงินเข้มคือ "คำ"
สำหรับบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงผลกรอบล้อมรอบ จุดเข้ามุม ข้อมูลการหมุน คะแนนความเชื่อมั่น ภาษาที่ระบบรู้จัก และข้อความที่รู้จัก
ตัวอย่างผลการแข่ง
ข้อความที่ระบุ | |
---|---|
ข้อความ | Wege der parlamentarischen Demokratie |
บล็อก | (1 บล็อก) |
บล็อก 0 | |
---|---|
ข้อความ | Wege Der Parlamentarischen Demokratie |
กรอบ | (296, 665 - 796, 882) |
จุดเข้ามุม | (296, 719), (778, 665), (796, 828), (314, 882) |
รหัสภาษาที่รู้จัก | de |
บรรทัด | (3 บรรทัด) |
บรรทัด 0 | |
---|---|
ข้อความ | เวเก เดอร์ |
กรอบ | (434, 678 - 670, 749) |
จุดเข้ามุม | (434, 705), (665, 678), (670, 722), (439, 749) |
รหัสภาษาที่รู้จัก | de |
คะแนนความเชื่อมั่น | 0.8766741 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (2 องค์ประกอบ) |
องค์ประกอบ 0 | |
---|---|
ข้อความ | เวช |
กรอบ | (434, 689 - 575, 749) |
จุดเข้ามุม | (434, 705), (570, 689), (575, 733), (439, 749) |
รหัสภาษาที่รู้จัก | de |
คะแนนความเชื่อมั่น | 0.8964844 |
องศาการหมุน | -6.6116457 |
องค์ประกอบ | (4 องค์ประกอบ) |
สัญลักษณ์ 0 | |
---|---|
ข้อความ | W |
กรอบ | (434, 698 - 500, 749) |
จุดเข้ามุม | (434, 706), (495, 698), (500, 741), (439, 749) |
คะแนนความเชื่อมั่น | 0.87109375 |
องศาการหมุน | -6.611646 |