결정 트리

결정 포레스트 모델은 결정 트리로 구성됩니다. 결정 포레스트 랜덤 포레스트와 같은 학습 알고리즘은 적어도 부분적으로는 결정 트리를 학습하게 됩니다.

이 섹션에서는 작은 데이터 세트 예시를 살펴보고 학습하는 방법을 배웁니다. 다음 섹션에서는 결정 트리가 결합되어 결정 포레스트를 학습시킵니다.

YDF 코드

YDF에서 CART 학습자를 사용하여 개별 결정 트리 모델을 학습시킵니다.

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

모델

결정 트리는 여러 '질문'의 모음으로 구성된 모델입니다 구성됨 계층적으로 트리 형태입니다. 질문은 일반적으로 조건, 분할 또는 테스트 중 하나입니다. 여기서는 '조건'이라는 용어를 인치 이 클래스를 사용합니다. 각 리프가 아닌 노드에는 조건이, 각 리프 노드는 학습합니다.

식물나무는 일반적으로 뿌리가 아래쪽에 있어 자랍니다. 결정이 트리는 일반적으로 상단에 있는 루트 (첫 번째 노드)로 표시됩니다.

두 개의 조건과 세 개의 리프가 포함된 결정 트리 첫 번째
조건 (루트)이 num_legs >= 3입니다. 두 번째 조건은
num_eyes >= 3입니다. 잎 세 개는 펭귄, 거미,
개의 단어로 구성됩니다.

<ph type="x-smartling-placeholder"></ph> 그림 1. 간단한 분류 결정 트리 녹색 범례는 결정 트리의 한 유형입니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.

 

의사 결정 트리 모델의 추론은 루트 (최상위)를 루트 노드 (하단)의 리프 노드 중 하나로 조건일 수 있습니다 도달한 리프의 값은 결정 트리의 예측입니다. 방문한 노드의 집합을 추론 경로라고 합니다. 예를 들어 다음과 같은 특성 값을 고려하세요.

num_legs num_eyes
4 2

예측은 dog입니다. 추론 경로는 다음과 같습니다.

  1. num_legs ≥ 3 → 예
  2. num_eyes ≥ 3 → 아니요

그림 1과 동일한 그림이지만 이 그림은
  두 조건을 통과하는 추론 경로로, 강아지의 잎에서 끝납니다.

<ph type="x-smartling-placeholder"></ph> 그림 2. 예에서 나뭇잎 *개* 에서 끝나는 추론 경로 *{num_legs : 4, num_eyes : 2}*입니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.

 

이전 예에서 결정 트리의 리프에는 분류가 포함되며 예측 즉, 각 잎사귀에는 한 세트의 동물종이 생물의 흔적을 찾을 수 있습니다.

마찬가지로 결정 트리는 잎사귀에 라벨을 지정하여 숫자 값을 예측할 수 있습니다. 회귀 예측 (숫자 값)을 제공합니다. 예를 들어 나무가 동물의 귀여움 점수를 숫자 0에서 10 사이로 예측합니다.

각 리프가 서로 다른 부동 소수점을 포함하는 결정 트리
  있습니다.

<ph type="x-smartling-placeholder"></ph> 그림 3. 수치 예측을 하는 결정 트리 를 통해 개인정보처리방침을 정의할 수 있습니다.