Эта страница переведена с помощью Cloud Translation API.

Распознавание текста v2, Распознавание текста v2

API распознавания текста ML Kit v2 может распознавать текст в любом наборе символов китайского, деванагари, японского, корейского и латинского языков. API также можно использовать для автоматизации задач ввода данных, таких как обработка кредитных карт, квитанций и визитных карточек.

iOS Android

Ключевые возможности

Распознавание текста в различных сценариях и языках. Поддерживает распознавание текста в китайском, деванагари, японском, корейском и латинском алфавитах.
Анализирует структуру текста. Поддерживает обнаружение символов, элементов, строк и абзацев.
Определить язык текста Определяет язык распознанного текста
Распознавание в реальном времени Может распознавать текст в режиме реального времени на широком спектре устройств.

Текстовая структура

Распознаватель текста сегментирует текст на блоки, строки, элементы и символы. Грубо говоря:

Блок — это непрерывный набор текстовых строк, например абзац или столбец.
Линия — это непрерывный набор слов на одной оси, а
Элемент — это непрерывный набор буквенно-цифровых символов («слово») на одной оси в большинстве латинских языков или слово в других.
Символ — это один буквенно-цифровой символ на одной оси в большинстве латинских языков или символ в других.

На изображении ниже показаны примеры каждого из них в порядке убывания. Первый выделенный блок, выделенный голубым цветом, представляет собой блок текста. Второй набор выделенных блоков синего цвета — это строки текста. Наконец, третий набор выделенных блоков темно-синего цвета — это слова.

Для всех обнаруженных блоков, линий, элементов и символов API возвращает ограничивающие рамки, угловые точки, информацию о повороте, оценку достоверности, распознанные языки и распознанный текст.

Примеры результатов

Распознанный текст
Текст	Веге парламентарий Демократия
Блоки	(1 блок)

Блок 0
Текст	Wege der parlamentarischen Demokratie
Рамка	(296, 665 - 796, 882)
Угловые точки	(296, 719), (778, 665), (796, 828), (314, 882)
Код признанного языка	де
Линии	(3 строки)

Линия 0
Текст	Wege дер
Рамка	(434, 678 - 670, 749)
Угловые точки	(434, 705), (665, 678), (670, 722), (439, 749)
Код признанного языка	де
Оценка уверенности	0,8766741
Степень вращения	-6,6116457
Элементы	(2 элемента)

Элемент 0
Текст	Веге
Рамка	(434, 689 - 575, 749)
Угловые точки	(434, 705), (570, 689), (575, 733), (439, 749)
Код признанного языка	де
Оценка уверенности	0,8964844
Степень вращения	-6,6116457
Элементы	(4 элемента)

Символ 0
Текст	Вт
Рамка	(434, 698 - 500, 749)
Угловые точки	(434, 706), (495, 698), (500, 741), (439, 749)
Оценка уверенности	0,87109375
Степень вращения	-6,611646