Rozpoznawanie tekstu, wersja 2

Interfejs ML Kit Text Recognition v2 może rozpoznawać tekst w dowolnym zestawie znaków chińskiego, dewanagari, japońskiego, koreańskiego i łacińskiego. Interfejsu API można też użyć do automatyzacji zadań związanych z wprowadzaniem danych, takich jak przetwarzanie kart kredytowych, rachunków i kart firmowych.

iOS Android

Kluczowe funkcje

  • Rozpoznawanie tekstu w różnych skryptach i językach Obsługa rozpoznawania tekstu w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim
  • Analizuje strukturę tekstu Obsługa wykrywania symboli, elementów, linii i akapitów
  • Określ język tekstu Określa język rozpoznanego tekstu
  • Rozpoznawanie w czasie rzeczywistym: rozpoznaje tekst w czasie rzeczywistym na wielu różnych urządzeniach.

Struktura tekstu

Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. Ogólnie rzecz biorąc:

  • Blokowanie to zestaw sąsiadujących ze sobą wierszy tekstu, takich jak akapit czy kolumna.

  • Linia to ciągła lista słów na tej samej osi,

  • Element to ciągły zestaw znaków alfanumerycznych („słowo”) na tej samej osi w większości języków łacińskich lub słowo w innych językach

  • Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach.

Przykłady poniżej każdego z nich są przedstawione w porządku malejącym. Pierwszy zaznaczony błękitny blok to blok tekstu. Drugi zestaw podświetlonych na niebiesko bloków to wiersze tekstu. Trzecim wyróżnionym blokiem tekstu jest ciemnoniebieski.

W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożnika, informacje o rotacji, wskaźnik ufności, rozpoznane języki oraz rozpoznany tekst.

Przykładowe wyniki


Zdjęcie: Dietmar Rabich, Wikimedia Commons, „Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123”, CC BY-SA 4.0
Rozpoznany tekst
Tekst Nietuzinkowy
wytwórnia papierosów
Demokratie
Bloki (1 blok)
Zablokuj 0
Tekst Wege der Parlamentarischen Demokratie
Ramka (296, 665–796, 882)
Punkty narożnika (296, 719), (778, 665), (796, 828), (314, 882)
Kod rozpoznanego języka de
Linie (3 wiersze)
Wiersz 0
Tekst Wege der
Ramka (434, 678–670, 749)
Punkty narożnika (434, 705), (665, 678), (670, 722), (439, 749)
Kod rozpoznanego języka de
Wskaźnik ufności 0,8766741
Stopień rotacji –6,6116457
Elementy (2 elementy)
Element 0
Tekst Wege
Ramka (434, 689 - 575, 749)
Punkty narożnika (434, 705), (570, 689), (575, 733), (439, 749)
Kod rozpoznanego języka de
Wskaźnik ufności 0,8964844
Stopień rotacji –6,6116457
Elementy (4 elementy)
Symbol 0
Tekst Ś
Ramka (434, 698 - 500, 749)
Punkty narożnika (434, 706), (495, 698), (500, 741), (439, 749)
Wskaźnik ufności 0,87109375
Stopień rotacji –6,611646