Digitalizador de documentos

A digitalização de documentos físicos, que permite converter documentos físicos em formatos digitais se tornou uma jornada do usuário muito comum em apps para dispositivos móveis. A API de scanner de documentos do Kit de ML oferece uma solução abrangente com um fluxo de interface consistente e de alta qualidade em apps e dispositivos Android. Depois que o fluxo do scanner é acionado no app, os usuários têm controle total sobre o processo. Eles também podem cortar os documentos digitalizados, aplicar filtros, remover sombras ou manchas e enviar os arquivos digitalizados com facilidade para o app.

O fluxo da interface, os modelos de ML e outros grandes recursos são entregues usando o Google Play Services, o que significa que:

  • Baixo impacto sobre o tamanho do binário (todos os modelos de ML e grandes recursos são transferidos de forma centralizada no Google Play Services).
  • Nenhuma permissão de câmera é necessária. O scanner de documentos utiliza a permissão de câmera do Google Play Services, e os usuários controlam quais arquivos devem ser compartilhados com seu app.

Todo o fluxo do scanner funciona no dispositivo.

Android

Principais recursos

  • Interface do usuário consistente e de alta qualidade para digitalizar documentos físicos.
  • Captura automática com detecção de documentos
  • Detecção precisa das bordas para otimizar os resultados do corte.
  • Detecção automática de rotação para mostrar os documentos na posição vertical.
  • Funcionalidades de edição para cortar, aplicar filtros, remover sombras, limpar manchas e enviar arquivos digitalizados de volta para o app.
  • Processamento no dispositivo, preservando a privacidade do usuário.
  • Nenhuma permissão de câmera é necessária no seu app.
  • Baixo impacto no tamanho do binário de APK.

Personalização

A API document scanner oferece um fluxo de interface completo e de alta qualidade consistente em todos os apps Android. No entanto, também há espaço para personalizar alguns aspectos da experiência do usuário:

  • Número máximo de páginas:
    Defina um limite para o número de páginas verificadas.

  • Importação de galeria:
    ative ou desative o recurso de importação da galeria de fotos.

  • Funcionalidades de edição:
    Personalize as funcionalidades de edição disponíveis para o usuário escolhendo um destes três modos:

    • SCANNER_MODE_BASE: recursos básicos de edição (cortar, girar, reordenar páginas etc.).
    • SCANNER_MODE_BASE_WITH_FILTER: adiciona filtros de imagem (escala de cinza, aprimoramento automático de imagem etc.) ao modo SCANNER_MODE_BASE.
    • SCANNER_MODE_FULL (padrão): adiciona recursos de limpeza de imagem ativados por ML (apagar manchas, dedos etc.) ao modo SCANNER_MODE_BASE_WITH_FILTER. Esse modo também vai permitir que futuros recursos importantes sejam adicionados automaticamente com as atualizações do Google Play Services, enquanto os outros dois vão manter os conjuntos de recursos atuais e receber apenas pequenos refinamentos.
Modo básico Modo básico com filtro Modo completo

Resultados de exemplo

Imagem original Documento digitalizado com a perspectiva corrigida, remoção de dobras e filtro de escala de cinza aplicado
Imagem original O documento digitalizado é girado automaticamente com mancha removida e filtro de cor aplicado
Imagem original Documento digitalizado com mancha removida e filtro automático aplicado
Imagem original O documento digitalizado é girado automaticamente com a sombra removida e o filtro automático aplicado
Imagem original O documento digitalizado é girado automaticamente com a remoção do dedo e o filtro automático aplicado