检查您的理解情况:模型调试

对于以下问题,请点击您选择的答案以展开并查看答案。

建模方法

你和朋友 Mel 像独角兽。事实上,您非常喜欢独角兽,因此决定使用机器学习技术来预测独角兽的外貌。您的数据集包含 10000 次独角兽出现。对于每次出现时,数据集都包含位置、时间、海拔、温度、湿度、人口密度、树冠、彩虹的存在以及许多其他特征。

您想要开始开发机器学习模型。以下哪种方法适合开始开发?
独角兽通常在黎明和黄昏时分出现。因此,请使用“时段”功能来创建线性模型。
正确。使用一两个高预测特征的线性模型是非常有效的入门方式。
预测独角兽的形象是一个非常棘手的问题。因此,请使用具有所有可用功能的深度神经网络。
错误。从复杂的模型开始会使调试变得复杂。
从简单的线性模型开始,但使用所有特征以确保简单模型具有预测能力。
错误。如果您使用很多特征,即使使用线性模型,生成的模型也会很复杂且难以调试。

基准

利用回归方法以及均方误差 (MSE) 损失来预测,您将根据行程的时长、距离、出发地和结束点预测出租车行程的费用。您知道:

  • 平均乘车费用为 15 美元。
  • 行程费用每增加 1 公里,就会增加固定金额。
  • 市区的游乐设施需要额外付费。
  • 行程起步价最低为 3 美元。

确定以下基准是否有用。

这是一个有用的基线:每次行程的费用为 15 美元。
正确。平均费用是一个有用的基准。
错误。始终预测平均值会导致 MSE 低于始终预测任何其他值。因此,根据此基准测试模型提供了有意义的比较结果。
具体取决于约车费用的标准差。
错误。无论标准偏差如何,行程的平均费用都是一个有用的基准,因为与始终预测任何其他值相比,预测平均值会导致较低的 MSE。
这是一个有用的基准:经过训练且仅使用时长和原点作为特征的模型。
错误。只有在在生产环境中完全训练模型后,才应将其用作基准。此外,经过训练的模型本身应针对更简单的基准进行验证。
正确。只有在在生产环境中完全训练模型后,才能将其用作基准。
这是一个有用的基线:行程费用是骑行距离(以公里为单位)乘以每公里费用。
正确。距离是确定约车费用的最重要因素。因此,依赖距离的基准很有用。
错误。距离是确定行程费用的最重要因素。因此,依赖距离的基准很有用。
这是一个有用的基线:每次行程的费用为 1 美元。因为模型必须始终高于此基准。如果模型没有超过此基准,我们就可以确定模型存在错误。
错误。这是一个有用的基准,因为它始终不正确。将模型与始终错误的基准进行比较没有意义。
正确。此基准不是模型的有用测试。

超参数

以下问题描述了训练分类器时遇到的问题。选择可解决所述问题的操作。

训练损失为 0.24,验证损失为 0.36。以下哪两项操作可以减小训练损失与验证损失之间的差异?
确保训练集和验证集具有相同的统计属性。
正确。如果训练集和验证集的统计属性不同,训练数据将无助于预测验证数据。
使用正则化来防止过拟合。
正确。如果训练损失小于验证损失,则表示您的模型可能与训练数据过拟合。正则化可防止过拟合。
增加训练周期数。
错误。如果训练损失小于验证损失,那么您的模型通常与训练数据过拟合。增加训练周期只会增加过拟合。
降低学习速率。
错误。如果验证损失大于训练损失,通常表示过拟合。更改学习速率不会减少过拟合。
您执行上一个问题中描述的正确操作,现在训练和验证损失在许多周期后从 1.0 减少到大约 0.24。以下哪项操作可以进一步减少训练损失?
增加神经网络的深度和宽度。
正确。如果在训练多个周期后您的训练损失在 0.24 处保持不变,那么您的模型可能缺乏进一步降低损失的预测能力。增加模型的深度和宽度可以使模型具备额外的预测能力,以进一步减少训练损失。
增加训练周期数。
错误。如果在经过多个周期的训练后,您的训练损失仍保持 0.24,那么继续训练模型可能不会导致训练损失明显减少。
提高学习速率。
错误。考虑到训练周期没有降低,增加学习速率可能不会降低最终的训练损失。相反,提高学习速率可能会导致训练不稳定,并阻止模型学习数据。
您在上一个问题中执行了正确的操作。模型的训练损失降至 0.20。假设您需要进一步减少模型的训练损失。您将添加一些似乎具有预测能力的功能。不过,训练损失继续在 0.20 左右波动。以下哪三个选项可以减少训练损失?
增加图层的深度和宽度。
正确。您的模型可能缺乏学习新功能中的预测性信号的能力。
增加训练周期。
错误。如果模型的训练损失在 0.20 左右波动,则增加训练周期数可能会导致模型的训练损失继续在 0.20 左右波动。
功能不会添加与现有功能相关的信息。请尝试其他功能。
正确。您使用的特征中可能已有这些特征编码的预测信号。
降低学习速率。
正确。添加新功能可能会导致问题变得更加复杂。具体而言,损失波动表示学习速率过高,您的模型会跳到最小值。降低学习速率将让您的模型学习最小值。