数据集、泛化和过拟合:测试您的知识

  1. 以下哪一项是静态数据集的示例?

  2. 您正准备使用包含以下特征的数据集训练一个用于预测二手车售价的模型:yearmodelmileage。在检查数据集时,您发现 2500 个样本中有 150 个缺少里程值。以下哪些选项是合理的做法?(请选择所有适用选项)

    选择合适的多项回答。

  3. 您正在训练在线媒体服务的电影推荐模型,以预测用户是否喜欢给定的电影。以下哪项是表示“用户喜欢这部电影”的合理代理标签?(请选择所有适用选项)

    选择合适的多项回答。

  4. 判断对错:训练模型,直到在测试数据上达到较低的损失值,是防止过拟合的好方法。

  5. 请在下面的空白处填入适当的内容:
    正则化会在训练期间惩罚 ___,从而提高模型泛化到新数据的能力。