此页面由 Cloud Translation API 翻译。

适合决策森林的数据

当您拥有表格数据集（您可能在电子表格、CSV 文件或数据库表中表示的数据）时，决策树最为有效。表格数据是最常见的数据格式之一，决策树应是用于对其进行建模的“首选”解决方案。

表 1. 表格数据集示例。

航段数	眼睛数量	重量（磅）	物种（标签）
2	2	12	企鹅
8	6	0.1	蜘蛛
4	2	44	狗
…	…	…	…

与神经网络不同，决策树会原生使用模型表格数据。在开发决策森林时，您无需执行以下任务：

不过，决策树不适合直接使用非表格数据（也称为非结构化数据），例如图片或文本。是的，确实存在针对此限制的权宜解决方法，但神经网络通常能更好地处理非结构化数据。

性能

决策森林对样本的利用率很高。也就是说，决策树非常适合在小数据集上进行训练，或者在特征数 / 示例数比率较高（可能大于 1）的数据集上进行训练。虽然决策树对样本的利用效率很高，但与所有机器学习模型一样，决策树在有大量数据可用时效果最好。

决策树通常比类似的神经网络推理速度更快。例如，中等规模的决策森林可以在新型 CPU 上几微秒内完成推理。