Pengenalan teks

API Pengenalan Teks ML Kit dapat mengenali teks dalam setiap himpunan karakter berbasis Latin. Fitur ini juga dapat digunakan untuk mengotomatiskan tugas entri data seperti memproses kartu kredit, tanda terima, dan kartu nama.

iOS Android

Kemampuan utama

  • Mengenali teks dalam bahasa berbasis Latin Mendukung pengenalan teks menggunakan skrip Latin
  • Menganalisis struktur teks Mendukung deteksi kata/elemen, baris, dan paragraf
  • Identifikasi bahasa teks Mengidentifikasi bahasa teks yang dikenali
  • Jejak aplikasi yang kecil Di Android, API ditawarkan sebagai library yang tidak dipaketkan melalui Layanan Google Play
  • Pengenalan real-time Dapat mengenali teks secara real-time pada berbagai perangkat

Struktur teks

Pengenal Teks mengelompokkan teks menjadi blok, garis, elemen, dan simbol. Secara kasar:

  • Block adalah kumpulan baris teks yang berdekatan, seperti paragraf atau kolom,

  • Baris adalah kumpulan kata yang berdekatan pada sumbu yang sama, dan

  • Elemen adalah rangkaian karakter alfanumerik yang berdekatan ("kata") pada sumbu yang sama di sebagian besar bahasa Latin, atau kata dalam bahasa lain

  • Simbol adalah karakter alfanumerik tunggal pada sumbu yang sama di sebagian besar bahasa Latin, atau karakter lain

Gambar di bawah menyoroti contoh setiap urutannya dalam urutan menurun. Blok yang pertama ditandai, dalam warna cyan, adalah Blok teks. Set kedua blok yang ditandai, dengan warna biru, adalah Baris teks. Terakhir, kumpulan ketiga blok yang ditandai, dengan warna biru tua, adalah Kata.

Untuk semua blok, garis, elemen, dan simbol yang terdeteksi, API akan menampilkan kotak pembatas, titik sudut, informasi rotasi, skor keyakinan, bahasa yang dikenali, dan teks yang dikenali.

Hasil contoh


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Teks yang Dikenali
Teks Wege
der parlamentarischen
Demokratie
Blok (1 blok)
Blok 0
Teks Wege der parlamentarischen Demokratie
Bingkai (296.665 - 796.882)
Titik Sudut (296.719), (778.665), (796.828), (314.882)
Kode Bahasa yang Dikenali de
Jalur (3 baris)
Baris 0
Teks Wege der
Bingkai (434, 678 - 670, 749)
Titik Sudut (434, 705), (665, 678), (670, 722), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8766741
Derajat Rotasi -6,6116457
Elemen (2 elemen)
Elemen 0
Teks Wege
Bingkai (434, 689 - 575, 749)
Titik Sudut (434, 705), (570, 689), (575, 733), (439, 749)
Kode Bahasa yang Dikenali de
Skor Keyakinan 0,8964844
Derajat Rotasi -6,6116457
Elemen (4 elemen)
Simbol 0
Teks W
Bingkai (434, 698 - 500, 749)
Titik Sudut (434, 706), (495, 698), (500, 741), (439, 749)
Skor Keyakinan 0,87109375
Derajat Rotasi -6,611646