Metin tanıma

ML Kit Text Recognition API, Latin tabanlı bir karakter kümesindeki metinleri tanıyabilir. Kredi kartı, makbuz ve kartvizit işleme gibi veri girişi görevlerini otomatikleştirmek için de kullanılabilir.

iOS Android

Temel özellikler

  • Latin alfabesi kullanılan dillerdeki metinleri tanıma Latin alfabesini kullanarak metin tanımayı destekler
  • Metin yapısını analiz edin Kelimeleri/öğeleri, satırları ve paragrafları algılamayı destekler
  • Metnin dilini tanımlayın Tanınan metnin dilini tanımlar
  • Uygulamanın küçük ayak izi Android'de API, Google Play Hizmetleri aracılığıyla bir paket halinde kitaplık olarak sunulur
  • Gerçek zamanlı tanıma Çok çeşitli cihazlarda metinleri gerçek zamanlı olarak tanır

Metin yapısı

Metin Tanıyıcı, metni bloklar, çizgiler, öğeler ve simgeler halinde segmentlere ayırır. Kabaca ifade etmek gerekirse:

  • Engelleme, paragraf veya sütun gibi bitişik metin satırlarından oluşan bir gruptur.

  • Çizgi, aynı eksende birbirini takip eden bir kelime grubudur.

  • Öğe, Latin alfabesindeki çoğu dilde aynı eksende veya başka kelimelerdeki bitişik alfanümerik karakter kümesidir ("kelime")

  • Sembol, Latin alfabesindeki çoğu dilde aynı eksende bulunan veya diğer karakterlerdeki tek bir alfanümerik karakterdir

Aşağıdaki resimde, bu örneklerin her biri azalan düzende listelenmiştir. Camgöbeğindeki ilk vurgulanan blok, metin bloğudur. Mavi renkle vurgulanmış ikinci blok grubu, Metin satırlarıdır. Son olarak, koyu mavi renkte vurgulanan blokların üçüncü kelimeleri Kelime kümesidir.

Algılanan tüm bloklar, çizgiler, öğeler ve simgeler için API; sınırlama kutularını, köşe noktalarını, döndürme bilgilerini, güven puanını, tanınan dilleri ve tanınan metni döndürür.

Örnek sonuçlar


Fotoğraf: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Tanınan Metin
Metin Wege
der parlamentarischen
Demokratie
Blok (1 engelleme)
0'ı engelle
Metin Wege der parlamentarischen Demokrati
Çerçeve (296, 665 - 796, 882)
Köşe Noktaları (296, 719), (778, 665), (796, 828), (314, 882)
Tanınan Dil Kodu de
Çizgiler (3 satır)
Satır 0
Metin Wege Derder
Çerçeve (434, 678 - 670, 749)
Köşe Noktaları (434, 705), (665, 678), (670, 722), (439, 749)
Tanınan Dil Kodu de
Güven Puanı 0,8766741
Rotasyon Derecesi -6,6116457
Öğeler (2 öğe)
0. Öğe
Metin Ağrı
Çerçeve (434, 689 - 575, 749)
Köşe Noktaları (434, 705), (570, 689), (575, 733), (439, 749)
Tanınan Dil Kodu de
Güven Puanı 0,8964844
Rotasyon Derecesi -6,6116457
Öğeler (4 öğe)
0. sembol
Metin W
Çerçeve (434, 698 - 500, 749)
Köşe Noktaları (434, 706), (495, 698), (500, 741), (439, 749)
Güven Puanı 0,87109375
Rotasyon Derecesi -6,611646