训练集和测试集:Playground 练习

训练集和测试集

我们返回 Playground 以测试训练集和测试集。

本练习提供了从同一数据集提取的测试集和训练集。默认情况下,可视化图表仅显示训练集。如果您还想看到测试集,请点击可视化图表正下方的显示测试数据复选框。在可视化图表中,请注意以下区别:

  • 训练样本具有白色轮廓。
  • 测试样本具有黑色轮廓。

任务 1:使用指定设置运行 Playground,具体操作如下:

  1. 点击“Run/Pause”按钮:
  2. 观察测试损失值和训练损失值的变化。
  3. 当测试损失值和训练损失值停止更改或偶尔更改一次时,再次按“运行/暂停”按钮可暂停 Playground。
请注意测试损失与训练损失之间的增量。我们将在以下任务中尝试减少此增量。

任务 2:执行以下操作:

  1. 按“重置”按钮。
  2. 修改学习速率
  3. 按“Run/Pause”按钮:
  4. 让 Playground 运行至少 150 个周期。

采用这种新的学习速率时,测试损失与训练损失之间的差值是更低还是更高?如果同时修改学习速率和批次大小,会发生什么情况?

(可选)任务 3:您可以通过标签为训练数据百分比 (Training data percentage) 的滑块控制训练数据与测试数据之比。例如,如果设置为 90%,则表示 90% 的数据用于训练集,其余 10% 用于测试集。

执行以下操作:

  1. 将“训练数据百分比”从 50% 减少到 10%。
  2. 尝试不同的学习速率和批次大小,并记录您的发现。
改变训练数据百分比会改变您在任务 2 中发现的最佳学习设置吗?如果是,原因是什么?