Riconoscimento del testo v2

L'API ML Kit Text Recognition 2 è in grado di riconoscere il testo in qualsiasi set di caratteri cinesi, devanagari, giapponesi, coreani e latini. L'API può essere utilizzata anche per automatizzare attività di inserimento dati come l'elaborazione di carte di credito, ricevute e biglietti da visita.

iOS Android

Funzionalità chiave

  • Riconosci il testo in vari linguaggi e lingue Supporta il riconoscimento dei testi in cinese, devanagari, giapponese, coreano e latino
  • Analizza la struttura del testo Supporta il rilevamento di simboli, elementi, righe e paragrafi
  • Identifica la lingua del testo Identifica la lingua del testo riconosciuto
  • Riconoscimento in tempo reale può riconoscere il testo in tempo reale su una vasta gamma di dispositivi

Struttura del testo

Lo strumento di riconoscimento del testo suddivide il testo in blocchi, righe, elementi e simboli. In breve:

  • un blocco è un insieme contiguo di righe di testo, come un paragrafo o una colonna,

  • Una linea è un insieme di parole contigue sullo stesso asse; e

  • un Elemento è un insieme contiguo di caratteri alfanumerici ("parola") sullo stesso asse nella maggior parte delle lingue latine o in una parola negli altri

  • un Simbolo è un singolo carattere alfanumerico sullo stesso asse nella maggior parte delle lingue latine o un carattere in altre

L'immagine seguente mostra alcuni esempi in ordine decrescente. Il primo blocco evidenziato, in ciano, è un blocco di testo. La seconda serie di blocchi evidenziati, in blu, è Righe di testo. Infine, il terzo insieme di blocchi evidenziati, in blu scuro, sono Words.

Per tutti i blocchi, le linee, gli elementi e i simboli rilevati, l'API restituisce riquadri di delimitazione, punti angolari, informazioni sulla rotazione, punteggio di affidabilità, lingue riconosciute e testo riconosciuto.

Risultati di esempio


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Testo riconosciuto
Testo Wege
der parlamentarischen
Demokratie
Blocchi (1 blocco)
Blocca 0
Testo Mug der parlamentarischen Demokratie
Frame (296, 665 - 796, 882)
Punti d'angolo (296, 719), (778, 665), (796, 828), (314, 882)
Codice lingua riconosciuto de
Linee (3 righe)
Riga 0
Testo Wege der
Frame (434, 678 - 670, 749)
Punti d'angolo (434, 705), (665, 678), (670, 722), (439, 749)
Codice lingua riconosciuto de
Punteggio di affidabilità 0,8766741
Grado di rotazione -6,6116457
Elementi (2 elementi)
Elemento 0
Testo Wege
Frame (434, 689 - 575, 749)
Punti d'angolo (434, 705), (570, 689), (575, 733), (439, 749)
Codice lingua riconosciuto de
Punteggio di affidabilità 0,8964844
Grado di rotazione -6,6116457
Elementi (4 elementi)
Simbolo 0
Testo W
Frame (434, 698 - 500, 749)
Punti d'angolo (434, 706), (495, 698), (500, 741), (439, 749)
Punteggio di affidabilità 0,87109375
Grado di rotazione -6,611646