결정 포레스트 모델은 결정 트리로 구성됩니다. 결정 포레스트 랜덤 포레스트와 같은 학습 알고리즘은 적어도 부분적으로는 결정 트리를 학습하게 됩니다.
이 섹션에서는 작은 데이터 세트 예시를 살펴보고 학습하는 방법을 배웁니다. 다음 섹션에서는 결정 트리가 결합되어 결정 포레스트를 학습시킵니다.
YDF에서 CART 학습자를 사용하여 개별 결정 트리 모델을 학습시킵니다.
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
모델
결정 트리는 여러 '질문'의 모음으로 구성된 모델입니다 구성됨 계층적으로 트리 형태입니다. 질문은 일반적으로 조건, 분할 또는 테스트 중 하나입니다. 여기서는 '조건'이라는 용어를 인치 이 클래스를 사용합니다. 각 리프가 아닌 노드에는 조건이, 각 리프 노드는 학습합니다.
식물나무는 일반적으로 뿌리가 아래쪽에 있어 자랍니다. 결정이 트리는 일반적으로 상단에 있는 루트 (첫 번째 노드)로 표시됩니다.
<ph type="x-smartling-placeholder"></ph> 그림 1. 간단한 분류 결정 트리 녹색 범례는 결정 트리의 한 유형입니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.
의사 결정 트리 모델의 추론은 루트 (최상위)를 루트 노드 (하단)의 리프 노드 중 하나로 조건일 수 있습니다 도달한 리프의 값은 결정 트리의 예측입니다. 방문한 노드의 집합을 추론 경로라고 합니다. 예를 들어 다음과 같은 특성 값을 고려하세요.
num_legs | num_eyes |
---|---|
4 | 2 |
예측은 dog입니다. 추론 경로는 다음과 같습니다.
- num_legs ≥ 3 → 예
- num_eyes ≥ 3 → 아니요
<ph type="x-smartling-placeholder"></ph> 그림 2. 예에서 나뭇잎 *개* 에서 끝나는 추론 경로 *{num_legs : 4, num_eyes : 2}*입니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.
이전 예에서 결정 트리의 리프에는 분류가 포함되며 예측 즉, 각 잎사귀에는 한 세트의 동물종이 생물의 흔적을 찾을 수 있습니다.
마찬가지로 결정 트리는 잎사귀에 라벨을 지정하여 숫자 값을 예측할 수 있습니다. 회귀 예측 (숫자 값)을 제공합니다. 예를 들어 나무가 동물의 귀여움 점수를 숫자 0에서 10 사이로 예측합니다.
<ph type="x-smartling-placeholder"></ph> 그림 3. 수치 예측을 하는 결정 트리 를 통해 개인정보처리방침을 정의할 수 있습니다.