Dokumentenscanner

Die Digitalisierung physischer Dokumente, die es Nutzern ermöglicht, physische Dokumente in digitale Formate umzuwandeln, ist in mobilen Apps zu einem sehr verbreiteten Prozess geworden. Die Document Scanner API von ML Kit bietet eine umfassende Lösung mit einem hochwertigen, konsistenten UI-Flow für Android-Apps und -Geräte. Sobald der Dokumentenscanner über Ihre Anwendung ausgelöst wird, behalten die Nutzer die volle Kontrolle über den Scanvorgang. Sie können die gescannten Dokumente optional zuschneiden, Filter anwenden, Schatten oder Flecken entfernen und die digitalisierten Dateien einfach an Ihre Anwendung zurücksenden.

Der UI-Ablauf, ML-Modelle und andere große Ressourcen werden mithilfe von Google Play-Diensten bereitgestellt. Das bedeutet:

  • Geringe Auswirkungen auf die binäre Größe (alle ML-Modelle und großen Ressourcen werden zentral in Google Play-Diensten heruntergeladen).
  • Es ist keine Kameraberechtigung erforderlich. Der Dokumentenscanner verwendet die Kameraberechtigung der Google Play-Dienste und die Nutzer können festlegen, welche Dateien für Ihre App freigegeben werden.

Der gesamte Ablauf des Dokumentenscanners wird auf dem Gerät ausgeführt.

Android

Hauptmerkmale

  • Hochwertige und einheitliche Benutzeroberfläche zum Digitalisieren physischer Dokumente.
  • Automatische Erfassung mit Dokumenterkennung.
  • Genaue Kantenerkennung für optimale Zuschnittergebnisse
  • Automatische Erkennung der Drehung, um Dokumente aufrecht zu zeigen
  • Bearbeitungsfunktionen zum Zuschneiden, Anwenden von Filtern, Entfernen von Schatten, Entfernen von Flecken und nahtloses Senden digitalisierter Dateien an Ihre App
  • Verarbeitung auf dem Gerät unter Wahrung des Datenschutzes für Nutzer
  • Es ist keine Kameraberechtigung von Ihrer App aus erforderlich.
  • Geringe Auswirkungen auf die APK-Binärgröße.

Anpassbare

Die Document Scanner API bietet einen hochwertigen, vollwertigen UI-Ablauf, der in allen Android-Apps einheitlich ist. Es ist jedoch auch möglich, einige Aspekte der User Experience anzupassen:

  • Maximale Seitenanzahl:
    Legen Sie eine Beschränkung für die Anzahl der gescannten Seiten fest.

  • Galerieimport:
    Hier können Sie die Funktion zum Importieren aus der Fotogalerie aktivieren oder deaktivieren.

  • Bearbeitungsfunktionen:
    Sie können die Bearbeitungsfunktionen, die Nutzern zur Verfügung stehen, mithilfe von drei Modi anpassen:

    • SCANNER_MODE_BASE: grundlegende Bearbeitungsfunktionen (z. B. Zuschneiden, Drehen, Neuanordnen von Seiten)
    • SCANNER_MODE_BASE_WITH_FILTER: fügt dem SCANNER_MODE_BASE-Modus Bildfilter (Graustufen, automatische Bildoptimierung usw.) hinzu.
    • SCANNER_MODE_FULL (Standard): fügt dem SCANNER_MODE_BASE_WITH_FILTER-Modus ML-fähige Funktionen zur Bildbereinigung hinzu, z. B. Flecken und Finger entfernen. In diesem Modus können zusammen mit Updates für Google Play-Dienste auch zukünftige wichtige Funktionen automatisch hinzugefügt werden. Die anderen beiden Modi behalten ihre aktuellen Funktionen bei und erhalten nur kleinere Optimierungen.
Basismodus Basismodus mit Filter Alle Zugriffe

Beispielergebnisse

Originalbild Gescanntes Dokument mit korrigierter Perspektive, Entfernung von Falten und angewendetem Graustufenfilter
Originalbild Gescanntes Dokument automatisch gedreht, Fleck entfernt und Farbfilter angewendet
Originalbild Gescanntes Dokument mit entferntem Fleck und automatischem Filter
Originalbild Gescanntes Dokument automatisch gedreht, Schatten entfernt und automatisch Filter angewendet
Originalbild Gescanntes Dokument automatisch gedreht, Finger entfernt und automatisch Filter angewendet