简介

决策森林具有以下优势:

  • 它们比神经网络更容易配置。决策森林的超参数较少;此外,决策森林中的超参数提供了良好的默认值
  • 它们以原生方式处理数字、分类和缺失特征。这意味着与使用神经网络时相比,您需要编写的预处理代码要少得多,从而可以节省时间并减少错误源。
  • 它们通常能够提供开箱即用的出色结果,对噪声数据稳健,并且具有可解释的属性。
  • 它们基于小型数据集(< 100 万个样本)进行推断和训练,比神经网络快得多

决策森林在机器学习竞赛中产生了很好的效果,在许多工业任务中被大量使用。

本课程介绍决策树和决策森林。决策森林是一系列可解释的机器学习算法,非常擅长处理表格数据。决策森林可以执行下列操作:

YDF 代码
本课程解释了决策森林的工作原理,而不关注任何特定的库。不过,在整个课程中,文本框都是依赖于 YDF 决策森林库(但可以转换为其他决策森林库)的代码示例。

前提条件

本课程假定您已经完成以下课程或具备同等水平的知识:

祝您学习愉快!