训练集和测试集
我们返回 Playground 以测试训练集和测试集。
本练习提供了从同一数据集提取的测试集和训练集。默认情况下,可视化图表仅显示训练集。如果您还想看到测试集,请点击可视化图表正下方的显示测试数据复选框。在可视化图表中,请注意以下区别:
- 训练样本具有白色轮廓。
- 测试样本具有黑色轮廓。
任务 1:使用指定设置运行 Playground,具体操作如下:
- 点击“Run/Pause”按钮:
- 观察测试损失值和训练损失值的变化。
- 当测试损失值和训练损失值停止更改或偶尔更改一次时,再次按“运行/暂停”按钮可暂停 Playground。
任务 2:执行以下操作:
- 按“重置”按钮。
- 修改学习速率。
- 按“Run/Pause”按钮:
- 让 Playground 运行至少 150 个周期。
采用这种新的学习速率时,测试损失与训练损失之间的差值是更低还是更高?如果同时修改学习速率和批次大小,会发生什么情况?
(可选)任务 3:您可以通过标签为训练数据百分比 (Training data percentage) 的滑块控制训练数据与测试数据之比。例如,如果设置为 90%,则表示 90% 的数据用于训练集,其余 10% 用于测试集。
执行以下操作:
- 将“训练数据百分比”从 50% 减少到 10%。
- 尝试不同的学习速率和批次大小,并记录您的发现。