简介

决策树具有以下优势:

  • 与神经网络相比,它们更易于配置。决策树具有更少的超参数;此外,决策树中的超参数提供了良好的默认值
  • 它们原生处理数值、分类和缺失特征。这意味着,与使用神经网络相比,您编写的预处理代码要少得多,从而节省时间并减少错误来源。
  • 它们通常开箱即用,可获得良好的结果,对噪声数据具有鲁棒性,并且具有可解释的属性。
  • 与神经网络相比,它们在小数据集(少于 100 万个示例)上进行推理和训练的速度要快得多

决策树在机器学习竞赛中取得了出色的成效,并广泛应用于许多工业任务。

本课程介绍了决策树和决策森林。决策树是一类可解释的机器学习算法,在处理表格数据方面表现出色。决策森林可以执行以下操作:

YDF 代码
本课程介绍决策树的运作方式,但不会重点介绍任何特定库。不过,在本课程中,文本框中展示的代码示例依赖于 YDF 决策树库,但可以转换为其他决策树库。

前提条件

本课程假定您已完成以下课程或具有等同的知识:

祝您学习愉快!