소개

결정 트리는 다음과 같은 이점을 제공합니다.

  • 신경망보다 구성하기가 더 쉽습니다. 결정 포레스트에는 초매개변수가 더 적습니다. 또한 결정 포레스트의 초매개변수는 적절한 기본값을 제공합니다.
  • 숫자 특성, 범주형 특성, 누락된 특성을 기본적으로 처리합니다. 즉, 신경망을 사용할 때보다 훨씬 적은 사전 처리 코드를 작성할 수 있으므로 시간을 절약하고 오류 소스를 줄일 수 있습니다.
  • 이러한 모델은 바로 사용할 수 있는 우수한 결과를 제공하고, 노이즈가 있는 데이터에 강하며, 해석 가능한 속성을 갖는 경우가 많습니다.
  • 뉴럴 네트워크보다 훨씬 빠르게 소규모 데이터 세트(예: 100만 개 미만)에서 추론하고 학습합니다.

결정 트리는 머신러닝 대회에서 우수한 결과를 내며 많은 산업적 작업에 사용됩니다.

이 과정에서는 결정 트리와 결정 포레스트를 소개합니다. 결정 포레스트는 테이블 형식 데이터에 탁월한 해석 가능한 머신러닝 알고리즘 제품군입니다. 결정 포레스트는 다음을 실행할 수 있습니다.

YDF 코드
이 과정에서는 특정 라이브러리에 초점을 맞추지 않고 결정 트리의 작동 방식을 설명합니다. 하지만 과정 전반에서 텍스트 상자에는 YDF 결정 트리 라이브러리를 사용하지만 다른 결정 트리 라이브러리로 변환할 수 있는 코드 예시가 표시됩니다.

기본 요건

이 과정은 다음 과정을 완료했거나 이에 상응하는 지식을 보유하고 있다고 가정합니다.

유익한 학습 기회가 되길 바랍니다.