Reconhecimento de texto v2

A API Text Recognition v2 do Kit de ML pode reconhecer texto em qualquer conjunto de caracteres em chinês, devanágari, japonês, coreano e latino. A API também pode ser usada para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.

iOS Android

Principais recursos

  • Reconhecer texto em vários scripts e idiomas: permite o reconhecimento de textos em chinês, devanágari, japonês, coreano e latino
  • Analisa a estrutura do texto: oferece suporte à detecção de símbolos, elementos, linhas e parágrafos.
  • Identificar idioma do texto Identifica o idioma do texto reconhecido
  • Reconhecimento em tempo real: pode reconhecer texto em tempo real em uma grande variedade de dispositivos.

Estrutura do texto

O Reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Em termos gerais:

  • um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou coluna,

  • uma Linha é um conjunto contíguo de palavras no mesmo eixo, e

  • um Elemento é um conjunto contíguo de caracteres alfanuméricos ("palavra") no mesmo eixo na maioria dos idiomas latinos ou uma palavra nos outros.

  • um Símbolo é um caractere alfanumérico único no mesmo eixo na maioria dos idiomas latinos ou um caractere nos outros.

A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Finalmente, o terceiro conjunto de blocos destacados, em azul-escuro, são as Palavras.

Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, os cantos, as informações de rotação, a pontuação de confiança, os idiomas reconhecidos e o texto reconhecido.

Resultados de exemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido
Texto Wege
der parlamentarischen
Democratie
Blocks (1 bloco)
Bloco 0
Texto Wege der Parlamentarischen Demokratie
Quadro (296, 665 a 796, 882)
Pontos de canto (296, 719), (778, 665), (796, 828), (314, 882)
Código de idioma reconhecido de
linhas; (3 linhas)
Linha 0
Texto Wege der
Quadro (434, 678 a 670, 749)
Pontos de canto (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8766741
Grau de rotação -6,6116457
Elementos (2 elementos)
Elemento 0
Texto Wege
Quadro (434, 689 a 575, 749)
Pontos de canto (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8964844
Grau de rotação -6,6116457
Elementos (4 elementos)
Símbolo 0
Texto W
Quadro (434.698 a 500.749)
Pontos de canto (434, 706), (495, 698), (500, 741), (439, 749)
Pontuação de confiança 0,87109375
Grau de rotação -6,611646