텍스트 인식 v2

ML Kit Text Recognition v2 API는 한국어, 중국어, 데바나가리어, 한국어, 라틴 문자 집합의 텍스트를 인식할 수 있습니다. API를 사용하여 신용카드, 영수증, 명함 처리와 같은 데이터 입력 작업을 자동화할 수도 있습니다.

iOS Android

주요 기능

  • 다양한 스크립트와 언어에서 텍스트 인식 한국어, 중국어, 데바나가리어, 일본어, 라틴어 스크립트의 텍스트 인식을 지원합니다.
  • 텍스트 구조 분석 기호, 요소, 줄, 단락 감지를 지원합니다.
  • 텍스트 언어 식별 인식된 텍스트의 언어 식별
  • 실시간 인식 다양한 기기에서 실시간으로 텍스트를 인식할 수 있습니다.

텍스트 구조

텍스트 인식기는 텍스트를 블록, 선, 요소, 기호로 분류합니다. 대략적으로 설명하면 다음과 같습니다.

  • 블록은 단락이나 열과 같은 연속된 텍스트 행 집합입니다.

  • 은 동일한 축에 있는 연속된 단어 집합입니다.

  • 요소는 대부분의 라틴 언어에서 같은 축에 있는 연속된 영숫자 문자 ('단어') 또는 다른 언어의 단어입니다.

  • 기호는 대부분의 라틴 언어에서 같은 축에 있는 영숫자 문자 1개 또는 다른 언어의 문자입니다.

아래 이미지는 각각의 예시를 내림차순으로 보여줍니다. 초록색으로 표시된 첫 번째 블록은 텍스트 블록입니다. 파란색으로 강조표시된 두 번째 블록 세트는 텍스트 행입니다. 마지막으로, 세 번째 강조표시된 블록 세트(진한 파란색)는 단어입니다.

감지된 모든 블록, 선, 요소, 기호에 대해 API가 경계 상자, 모서리 지점, 회전 정보, 신뢰도 점수, 인식된 언어, 인식된 텍스트를 반환합니다.

결과 예시


사진: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
인식된 텍스트
텍스트 베게
데르 팔라멘타리첸
Demokratie
블록 (1개 블록)
블록 0
텍스트 베게 데르 팔라멘타리첸 민주크라티
프레임 (296, 665~796, 882)
코너 포인트 (296, 719), (778, 665), (796, 828), (314, 882)
인식된 언어 코드 de
노선 (3줄)
0행
텍스트 베게 데르
프레임 (434, 678 - 670, 749)
코너 포인트 (434, 705), (665, 678), (670, 722), (439, 749)
인식된 언어 코드 de
신뢰도 점수 0.8766741
회전 각도 -6.6116457
요소 (2개 요소)
엘리먼트 0
텍스트 베게
프레임 (434, 689 - 575, 749)
코너 포인트 (434, 705), (570, 689), (575, 733), (439, 749)
인식된 언어 코드 de
신뢰도 점수 0.8964844
회전 각도 -6.6116457
요소 (4개 요소)
기호 0
텍스트 W
프레임 (434, 698 - 500, 749)
코너 포인트 (434, 706), (495, 698), (500, 741), (439, 749)
신뢰도 점수 0.87109375
회전 각도 -6.611646