A API ML Kit Text Recognition pode reconhecer texto em qualquer conjunto de caracteres baseado no alfabeto latino. Ele também pode ser usado para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.
Principais recursos
- Reconhecer texto em idiomas latinos e suporta o reconhecimento de texto usando script latino
- Analisar estrutura do texto: oferece suporte à detecção de palavras/elementos, linhas e parágrafos
- Identificar idioma do texto Identifica o idioma do texto reconhecido
- Pegada de aplicativo pequena no Android, a API é oferecida como uma biblioteca desagrupada pelo Google Play Services
- Reconhecimento em tempo real: pode reconhecer texto em tempo real em vários dispositivos.
Estrutura do texto
O reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Cerca de:
um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou coluna.
uma linha é um conjunto contíguo de palavras no mesmo eixo; e
um Elemento é um conjunto contíguo de caracteres alfanuméricos ("word") no mesmo eixo na maioria das línguas latinas ou uma palavra em outros.
um Símbolo é um caractere alfanumérico no mesmo eixo na maioria dos idiomas latinos ou um caractere em outros
A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Por fim, o terceiro conjunto de blocos destacados, em azul escuro, são as palavras.
Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, os cantos, as informações de rotação, a pontuação de confiança, os idiomas e o texto reconhecidos.
Resultados de exemplo

Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido | |
---|---|
Texto | Wege der parlamentarischen Demokratie |
Bloqueios | (1 bloco) |
Bloco 0 | |
---|---|
Texto | Demoge der parlamentarischen Demokratie |
Quadro | (296.665 - 796.882) |
Pontos de canto | (296, 719), (778, 665), (796, 828), (314, 882) |
Código de idioma reconhecido | de |
linhas; | (3 linhas) |
Linha 0 | |
---|---|
Texto | Wege der |
Quadro | (434, 678 a 670, 749) |
Pontos de canto | (434, 705), (665, 678), (670, 722), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8766741 |
Grau de rotação | -6,6116457 |
Elementos | (2 elementos) |
Elemento 0 | |
---|---|
Texto | Geja |
Quadro | (434, 689 a 575.749) |
Pontos de canto | (434, 705), (570, 689), (575, 733), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8964844 |
Grau de rotação | -6,6116457 |
Elementos | (4 elementos) |
Símbolo | |
---|---|
Texto | W |
Quadro | (434, 698 a 500.749) |
Pontos de canto | (434, 706), (495, 698), (500, 741), (439, 749) |
Pontuação de confiança | 0,87109375 |
Grau de rotação | -6,611646 |