Skaner dokumentów

Digitalizacja dokumentów fizycznych, która umożliwia użytkownikom konwertowanie fizycznych dokumentów na formaty cyfrowe, stała się bardzo powszechnym procesem w przypadku aplikacji mobilnych. Interfejs Document Scanner API w ML Kit to kompleksowe rozwiązanie z wysokiej jakości i spójnym interfejsem użytkownika w aplikacjach i na urządzeniach na Androida. Po uruchomieniu procesu skanowania dokumentów w aplikacji użytkownicy zachowują pełną kontrolę nad procesem skanowania. Mogą też opcjonalnie przyciąć zeskanowane dokumenty, zastosować filtry, usunąć cienie i plamy oraz łatwo przesłać cyfrowe pliki z powrotem do aplikacji.

Proces interfejsu użytkownika, modele ML i inne duże zasoby są dostarczane przez Usługi Google Play, co oznacza, że:

  • Mały wpływ na rozmiar plików binarnych (wszystkie modele ML i duże zasoby są pobierane centralnie z Usług Google Play).
  • Nie są wymagane uprawnienia do korzystania z aparatu – skaner dokumentów korzysta z uprawnień Usług Google Play dotyczących aparatu, a użytkownicy mają kontrolę nad tym, które pliki udostępniać aplikacji.

Cały proces skanowania dokumentów odbywa się na urządzeniu.

Androida

Najważniejsze funkcje

  • Spójny, wysokiej jakości interfejs do digitalizacji fizycznych dokumentów.
  • Automatyczne przechwytywanie z wykrywaniem dokumentów.
  • Dokładne wykrywanie krawędzi zapewnia optymalne wyniki przycinania.
  • Automatyczne wykrywanie obrotu w celu wyświetlania dokumentów pionowo.
  • Funkcje edycji umożliwiające przycinanie, stosowanie filtrów, usuwanie cieni, usuwanie plam i bezproblemowe przesyłanie cyfrowych plików z powrotem do aplikacji.
  • Przetwarzanie na urządzeniu z zachowaniem prywatności użytkownika.
  • Aplikacja nie potrzebuje uprawnień do korzystania z aparatu.
  • Mały wpływ na rozmiar pliku binarnego APK.

Personalizacja

Interfejs Document Scanner API zapewnia wysokiej jakości w pełni funkcjonalny proces interfejsu użytkownika, który działa spójny w różnych aplikacjach na Androida. Możesz też jednak dostosować niektóre aspekty interfejsu użytkownika:

  • Maksymalna liczba stron:
    Ustaw limit liczby skanowanych stron.

  • Importowanie galerii:
    Włącz lub wyłącz możliwość importowania galerii z galerii.

  • Funkcje edycji:
    Możesz dostosowywać funkcje edycji dostępne dla użytkownika, wybierając jeden z 3 trybów:

    • SCANNER_MODE_BASE: podstawowe funkcje edycyjne (przycinanie, obracanie, zmiana kolejności stron itd.).
    • SCANNER_MODE_BASE_WITH_FILTER: dodaje filtry obrazu (skala szarości, automatyczne poprawianie jakości zdjęcia itp.) do trybu SCANNER_MODE_BASE.
    • SCANNER_MODE_FULL (domyślny): dodaje do trybu SCANNER_MODE_BASE_WITH_FILTER możliwości czyszczenia obrazów (usuwanie plam, odcisków palców itp.) za pomocą systemów uczących się. Umożliwi on też automatyczne dodawanie kolejnych głównych funkcji wraz z aktualizacjami Usług Google Play. W pozostałych dwóch trybach zostanie zachowany obecny zestaw funkcji i wprowadzimy tylko drobne ulepszenia.
Tryb podstawowy Tryb podstawowy z filtrem Tryb całego ruchu

Przykładowe wyniki

Oryginalne zdjęcie Skan dokumentu z poprawioną perspektywą, usuniętym zamazywaniem i zastosowanym filtrem skali szarości
Oryginalne zdjęcie Zeskanowany dokument został automatycznie obrócony z usuniętymi plamami i zastosowanym filtrem kolorów
Oryginalne zdjęcie Zeskanowany dokument z usuniętymi plamami i zastosowanym automatycznym filtrem
Oryginalne zdjęcie Zeskanowany dokument został automatycznie obrócony z usuniętym cieniem i zastosowanym automatycznym filtrem
Oryginalne zdjęcie Zeskanowany dokument został automatycznie obrócony z usuniętym palcem i zastosowany automatyczny filtr