이 단원에서는 결정을 내리는 데 사용되는 다양한 유형의 조건에 중점을 둡니다. 수 있습니다.
축 정렬 조건과 사선 조건 비교
축 정렬 조건에는 단일 특성만 포함됩니다. 경사 조건에는 여러 특성이 포함됩니다. 예를 들어 다음은 축 정렬 조건:
num_legs ≥ 2
다음은 사선 조건입니다.
num_legs ≥ num_fingers
결정 트리는 축에 정렬된 조건만으로 학습되는 경우가 많습니다. 하지만 사각 분할은 더 복잡한 표현을 표현하기 때문에 더 강력합니다. 학습합니다. 경사 분할은 때때로 비용을 들이면서 더 나은 결과를 산출할 수 있습니다. 더 높은 학습 및 추론 비용의 증가를 야기할 수 있습니다
split_axis="SPARSE_OBLIQUE"
매개변수
<ph type="x-smartling-placeholder"></ph> 그림 4. 축 정렬 조건 및 사선 조건의 예 를 통해 개인정보처리방침을 정의할 수 있습니다.
앞의 두 조건을 그래프로 나타내면 다음과 같은 특성 공간이 생성됩니다. 분리:
<ph type="x-smartling-placeholder"></ph> 그림 5. 그림 4의 조건을 위한 특성 공간 분리. 를 통해 개인정보처리방침을 정의할 수 있습니다.
바이너리 조건과 논바이너리 조건 비교
두 개의 가능한 결과 (예: true 또는 false)가 있는 조건을 호출합니다. 바이너리 조건을 참조하세요. 바이너리 조건만 포함하는 결정 트리는 바이너리 결정 트리라고 합니다.
논바이너리 조건은 가능한 결과가 3개 이상입니다. 따라서 이진 조건보다 더 큰 차별 능력이 있습니다. 논바이너리 조건을 하나 이상 포함하는 결정을 논바이너리 결정이라고 합니다. 트리입니다.
<ph type="x-smartling-placeholder"></ph> 그림 6: 바이너리 결정 트리와 논바이너리 결정 트리 비교. 를 통해 개인정보처리방침을 정의할 수 있습니다.
조건이 너무 많습니다. 과적합될 가능성도 큽니다 따라서 결정 포레스트는 일반적으로 이진 결정 트리를 사용하므로 이 과정에서는 이진 결정 트리에 중점을 둡니다.
가장 일반적인 조건 유형은 다음과 같이 표현되는 기준점 조건입니다.
feature ≥ threshold
예를 들면 다음과 같습니다.
num_legs ≥ 2
다른 유형의 조건도 있습니다. 다음은 일반적으로 사용되는 바이너리 조건:
<ph type="x-smartling-placeholder"></ph> 표 2. 바이너리 조건의 일반적인 유형입니다. 를 통해 개인정보처리방침을 정의할 수 있습니다.
이름 | 조건 | 예 |
임곗값 조건 | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
등호 조건 | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``고양이"$ |
인셋 조건 | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$ |
사위 | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
기능이 누락됨 | $\mathrm{feature}_i \mathrm{is} \mathrm{누락됨}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{누락됨}$ |