API распознавания текста ML Kit v2 может распознавать текст в любом наборе символов китайского, деванагари, японского, корейского и латинского языков. API также можно использовать для автоматизации задач ввода данных, таких как обработка кредитных карт, квитанций и визитных карточек.
Ключевые возможности
- Распознавание текста в различных сценариях и языках. Поддерживает распознавание текста в китайском, деванагари, японском, корейском и латинском алфавитах.
- Анализирует структуру текста. Поддерживает обнаружение символов, элементов, строк и абзацев.
- Определить язык текста Определяет язык распознанного текста
- Распознавание в реальном времени Может распознавать текст в режиме реального времени на широком спектре устройств.
Текстовая структура
Распознаватель текста сегментирует текст на блоки, строки, элементы и символы. Грубо говоря:
Блок — это непрерывный набор текстовых строк, например абзац или столбец.
Линия — это непрерывный набор слов на одной оси, а
Элемент — это непрерывный набор буквенно-цифровых символов («слово») на одной оси в большинстве латинских языков или слово в других.
Символ — это один буквенно-цифровой символ на одной оси в большинстве латинских языков или символ в других.
На изображении ниже показаны примеры каждого из них в порядке убывания. Первый выделенный блок, выделенный голубым цветом, представляет собой блок текста. Второй набор выделенных блоков синего цвета — это строки текста. Наконец, третий набор выделенных блоков темно-синего цвета — это слова.
Для всех обнаруженных блоков, линий, элементов и символов API возвращает ограничивающие рамки, угловые точки, информацию о повороте, оценку достоверности, распознанные языки и распознанный текст.
Примеры результатов
Распознанный текст | |
---|---|
Текст | Веге парламентарий Демократия |
Блоки | (1 блок) |
Блок 0 | |
---|---|
Текст | Wege der parlamentarischen Demokratie |
Рамка | (296, 665 - 796, 882) |
Угловые точки | (296, 719), (778, 665), (796, 828), (314, 882) |
Код признанного языка | де |
Линии | (3 строки) |
Линия 0 | |
---|---|
Текст | Wege дер |
Рамка | (434, 678 - 670, 749) |
Угловые точки | (434, 705), (665, 678), (670, 722), (439, 749) |
Код признанного языка | де |
Оценка уверенности | 0,8766741 |
Степень вращения | -6,6116457 |
Элементы | (2 элемента) |
Элемент 0 | |
---|---|
Текст | Веге |
Рамка | (434, 689 - 575, 749) |
Угловые точки | (434, 705), (570, 689), (575, 733), (439, 749) |
Код признанного языка | де |
Оценка уверенности | 0,8964844 |
Степень вращения | -6,6116457 |
Элементы | (4 элемента) |
Символ 0 | |
---|---|
Текст | Вт |
Рамка | (434, 698 - 500, 749) |
Угловые точки | (434, 706), (495, 698), (500, 741), (439, 749) |
Оценка уверенности | 0,87109375 |
Степень вращения | -6,611646 |