이미지 라벨 지정

ML Kit의 이미지 라벨 지정 API를 사용하면 광범위한 카테고리 그룹에서 이미지 내 항목에 대한 정보를 감지하고 추출할 수 있습니다. 기본 이미지 라벨 지정 모델은 일반 객체, 장소, 활동, 동물 종, 제품 등을 식별할 수 있습니다.

커스텀 이미지 분류 모델을 사용하여 감지를 특정 사용 사례에 맞게 조정할 수도 있습니다. 자세한 내용은 커스텀 TensorFlow Lite 모델 사용을 참조하세요.

주요 기능

  • 강력한 범용 기본 분류 기준은 사진에서 가장 흔하게 발견되는 객체를 설명하는 400개가 넘는 카테고리를 인식합니다.
  • 커스텀 모델로 사용 사례에 맞게 조정 TensorFlow Hub에서 사전 학습된 다른 모델 또는 TensorFlow, AutoML Vision Edge, TensorFlow Lite 모델 제작자로 학습된 자체 커스텀 모델을 사용합니다.
  • 사용하기 쉬운 상위 수준 API 저수준 모델 입력/출력, 이미지 사전/사후 처리 또는 처리 파이프라인을 빌드할 필요가 없습니다. ML Kit는 TensorFlow Lite 모델에서 라벨을 추출하고 텍스트 설명으로 제공합니다.

이 API는 전체 이미지를 설명하는 이미지 분류 모델용입니다. 이미지에서 하나 이상의 객체(예: 신발 또는 가구)를 분류하는 경우 객체 감지 및 추적 API가 더 적합할 수 있습니다.

지원되는 이미지 분류 모델

Image Labeling API는 다양한 이미지 분류 모델을 지원합니다.

지원되는 이미지 분류 모델
기본 모델 기본적으로 API는 사진에서 가장 흔하게 등장하는 개념을 다루는 400개가 넘는 항목을 인식하는 강력한 범용 이미지 라벨 지정 모델을 사용합니다.
커스텀 TensorFlow Lite 모델 API는 애플리케이션별 개념을 타겟팅하기 위해 다양한 소스의 커스텀 이미지 분류 모델을 허용합니다. 이는 TensorFlow Hub에서 다운로드한 선행 학습된 모델 또는 AutoML Vision Edge, TensorFlow Lite Model Maker 또는 TensorFlow 자체로 학습된 자체 모델일 수 있습니다. 모델을 앱과 번들로 묶거나 Firebase 머신러닝으로 호스팅하고 런타임에 다운로드할 수 있습니다.

기본 모델 사용

ML Kit의 기본 모델은 사람, 사물, 장소, 활동 등을 식별하는 항목 목록을 반환합니다. 각 항목에는 ML 모델의 관련성에 대한 신뢰도를 나타내는 점수가 제공됩니다. 이 정보를 사용하여 자동 메타데이터 생성 및 콘텐츠 검토와 같은 작업을 수행할 수 있습니다. ML Kit에서 제공하는 기본 모델은 400개가 넘는 항목을 인식합니다.

iOS Android

라벨 예시

Image Labeling API의 기본 모델은 다음 예시와 같이 400개 이상의 라벨을 지원합니다.

카테고리라벨 예시
직원 Crowd
Selfie
Smile
활동 Dancing
Eating
Surfing
Things Car
Piano
Receipt
동물 Bird
Cat
Dog
식물 Flower
Fruit
Vegetable
Places Beach
Lake
Mountain

결과 예시

다음은 첨부된 사진에서 인식된 항목의 예입니다.

사진: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
라벨 0
텍스트 경기장
신뢰도 0.9205354입니다.
라벨 1
텍스트 스포츠
신뢰도 0.7531109
라벨 2
텍스트 이벤트
신뢰도 0.66905296
라벨 3
텍스트 레저
신뢰도 0.59904146
라벨 4
텍스트 축구
신뢰도 0.56384534입니다.
라벨 5
텍스트 순 통계
신뢰도 0.54679185입니다.
라벨 6
텍스트 식물
신뢰도 0.524364

커스텀 TensorFlow Lite 모델 사용

ML Kit의 기본 이미지 라벨 지정 모델은 범용 용도로 빌드되었습니다. 사진에서 가장 흔하게 발견되는 객체를 설명하는 400개의 카테고리를 인식하도록 학습되었습니다. 꽃의 종류나 음식의 유형을 구분하는 모델과 같이 더 좁은 수의 카테고리를 더 자세히 인식하는 특수한 이미지 분류 모델이 앱에 필요할 수 있습니다.

이 API를 사용하면 다양한 소스에서 커스텀 이미지 분류 모델을 지원하여 특정 사용 사례에 맞게 맞춤설정할 수 있습니다. 자세한 내용은 ML Kit를 사용한 커스텀 모델을 참조하세요. 커스텀 모델을 앱과 번들로 묶거나 Firebase 머신러닝의 모델 배포 서비스를 사용하여 클라우드에서 동적으로 다운로드할 수 있습니다.

iOS Android

입력 이미지 사전 처리

필요한 경우 이미지 라벨 지정은 이중 선형 이미지 확장 및 확장을 사용하여 기본 이미지 모델의 요구사항에 맞게 입력 이미지 크기와 가로세로 비율을 조정합니다.