다중 클래스 신경망

앞에서 다음과 같은 두 가지 가능한 옵션 중 하나를 선택할 수 있는 이진 분류 모델을 접했습니다.

  • 주어진 이메일이 스팸이거나 스팸이 아닙니다.
  • 특정 종양이 악성 또는 양성임

이 모듈에서는 여러 가능성 중에서 선택할 수 있는 멀티클래스 분류를 살펴봅니다. 예를 들면 다음과 같습니다.

  • 이 개는 비글, 바셋하운드, 블러드하운드인가요?
  • 이 꽃이 시베리아 아이리스, 더치 아이리스, 블루 플래그 아이리스인가요, 드워프 비어디드 아이리스인가요?
  • 이 비행기가 보잉 747인가요, 에어버스 320인가요, 보잉 777인가요, 아니면 엠브라에르 190인가요?
  • 사과, 곰, 사탕, 개, 계란 이미지인가요?

현실에서 발생하는 멀티클래스 문제에서는 수백만 개의 클래스 중에서 하나를 선택해야 합니다. 예를 들어 거의 모든 것의 이미지를 식별할 수 있는 다중 클래스 분류 모델을 생각해 봅니다.

다중 클래스 신경망

  • 로지스틱 회귀는 이진 클래스 문제에 유용한 확률을 제공합니다.
    • 스팸 / 스팸 아님
    • 클릭 / 비클릭
  • 다중 클래스 문제는 어떤가요?
    • 사과, 바나나, 자동차, 심장병 전문의, ..., 걷기 기호, 얼룩말, 동물원
    • 빨간색, 주황색, 노란색, 녹색, 파란색, 남색, 보라색
    • 동물, 채소, 광물
  • 가능한 각 클래스에 고유한 출력 만들기
  • '내 클래스'와 '다른 모든 클래스'의 신호를 기반으로 학습
  • 심층 네트워크에서 또는 별도의 모델로 수행할 수 있음
히든 레이어 5개와 출력 레이어 5개가 있는 신경망
  • 제약 조건 추가: 1.0으로 합산하기 위해 모든 일대다 노드의 출력이 필요합니다.
  • 추가 제약조건은 학습이 빠르게 수렴하는 데 도움이 됩니다.
  • 또한 출력을 확률로 해석할 수 있습니다.
입력 레이어, 심화되지 않은 히든 레이어 2개, 소프트맥스 레이어, 소프트맥스 레이어와 동일한 수의 노드가 있는 출력 레이어가 있는 심층신경망
  • 다중 클래스, 단일 라벨 분류:
    • 하나의 클래스만 멤버일 수 있습니다.
    • 클래스가 상호 배타적이라는 제약 조건은 유용한 구조입니다.
    • 손실에서 인코딩하는 데 유용합니다.
    • 가능한 모든 클래스에 소프트맥스 손실 1개를 사용합니다.
  • 다중 클래스, 다중 라벨 분류:
    • 예시는 두 개 이상의 클래스의 멤버일 수 있습니다.
    • 악용할 수업 멤버십의 추가 제약조건이 없습니다.
    • 가능한 각 클래스의 로지스틱 회귀 손실 1개.
  • 전체 소프트맥스
    • 무차별 대입. 모든 클래스에 대해 계산합니다.
  • 전체 소프트맥스
    • 무차별 대입. 모든 클래스에 대해 계산합니다.
  • 후보 샘플링
    • 모든 양성 라벨에 대해 계산하지만 제외 음성 샘플에 대해서만 계산합니다.