การจดจําข้อความ v2

ML Kit Text Recognition v2 API สามารถจดจำข้อความในชุดอักขระจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน นอกจากนี้ API ยังนำมาใช้เพื่อดำเนินงานป้อนข้อมูลโดยอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตรได้ด้วย

iOS Android

ความสามารถหลัก

  • จดจำข้อความในสคริปต์และภาษาต่างๆ รองรับการจดจำข้อความในตัวอักษรจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน
  • วิเคราะห์โครงสร้างข้อความ รองรับการตรวจหาสัญลักษณ์ องค์ประกอบ บรรทัด และย่อหน้า
  • ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
  • การจดจำแบบเรียลไทม์ จดจำข้อความแบบเรียลไทม์ในอุปกรณ์ที่หลากหลายได้

โครงสร้างข้อความ

โปรแกรมจดจำข้อความจะแบ่งข้อความออกเป็นบล็อก เส้น องค์ประกอบ และสัญลักษณ์ กล่าวโดยคร่าวๆ:

  • บล็อกคือชุดบรรทัดข้อความต่อเนื่องกัน เช่น ย่อหน้าหรือคอลัมน์

  • เส้นคือชุดคำต่อกันบนแกนเดียวกัน และ

  • องค์ประกอบคือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("คำ") ที่อยู่ติดกันบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคำอื่นๆ

  • สัญลักษณ์คืออักขระที่เป็นตัวอักษรและตัวเลขคละกัน 1 ตัวบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระอื่นๆ

รูปภาพด้านล่างจะไฮไลต์ตัวอย่างของแต่ละตัวเลือกจากมากไปหาน้อย บล็อกแรกที่ไฮไลต์ด้วยสีฟ้าคือบล็อกข้อความ บล็อกไฮไลต์ชุดที่ 2 สีฟ้าคือ บรรทัดข้อความ สุดท้าย บล็อกที่ 3 ที่ไฮไลต์ใน สีน้ำเงินเข้มคือ "คำ"

สำหรับบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงผลกรอบล้อมรอบ จุดเข้ามุม ข้อมูลการหมุน คะแนนความเชื่อมั่น ภาษาที่ระบบรู้จัก และข้อความที่รู้จัก

ตัวอย่างผลการแข่ง


รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
ข้อความที่ระบุ
ข้อความ Wege
der parlamentarischen
Demokratie
บล็อก (1 บล็อก)
บล็อก 0
ข้อความ Wege Der Parlamentarischen Demokratie
กรอบ (296, 665 - 796, 882)
จุดเข้ามุม (296, 719), (778, 665), (796, 828), (314, 882)
รหัสภาษาที่รู้จัก de
บรรทัด (3 บรรทัด)
บรรทัด 0
ข้อความ เวเก เดอร์
กรอบ (434, 678 - 670, 749)
จุดเข้ามุม (434, 705), (665, 678), (670, 722), (439, 749)
รหัสภาษาที่รู้จัก de
คะแนนความเชื่อมั่น 0.8766741
องศาการหมุน -6.6116457
องค์ประกอบ (2 องค์ประกอบ)
องค์ประกอบ 0
ข้อความ เวช
กรอบ (434, 689 - 575, 749)
จุดเข้ามุม (434, 705), (570, 689), (575, 733), (439, 749)
รหัสภาษาที่รู้จัก de
คะแนนความเชื่อมั่น 0.8964844
องศาการหมุน -6.6116457
องค์ประกอบ (4 องค์ประกอบ)
สัญลักษณ์ 0
ข้อความ W
กรอบ (434, 698 - 500, 749)
จุดเข้ามุม (434, 706), (495, 698), (500, 741), (439, 749)
คะแนนความเชื่อมั่น 0.87109375
องศาการหมุน -6.611646