分类数据:特征组合练习

Playground 是一款交互式应用,可让您操纵机器学习模型训练和测试的各个方面。借助 Playground,您可以选择特征并调整超参数,然后了解您的选择对模型有何影响。

本页包含两项练习,您可以使用说明下方的嵌入式 Playground widget 完成这些练习。

练习 1:基本特征组合

在此练习中,请重点关注 Playground 界面中的以下部分:

  • 在“FEATURES”下方,您会看到三个潜在的模型特征:
    • x1
    • x2
    • x1x2
  • 在“输出”下方,您会看到一个包含橙点和蓝点的正方形。假设您正在查看一个正方形森林,其中橙点表示病树的位置,蓝点表示健康树的位置。
  • 在 FEATURES 和 OUTPUT 之间,如果您仔细观察,会看到三条细虚线将每个特征连接到输出。 每条虚线的宽度表示当前与每个特征关联的权重。这些线的颜色非常浅,因为每个特征的初始权重都初始化为 0。随着权重增大或减小,这些线条的粗细也会随之变化。

任务 1:通过执行以下操作来探索 Playground:

  1. 点击将特征 x1 连接到输出的细线。 系统会显示一个弹出式窗口。
  2. 在弹出式窗口中,输入权重 1.0
  3. 按 Enter 键。

请注意以下几点:

  • 随着权重从 0 增加到 1.0,x1 的虚线会变粗。
  • 现在,系统会显示橙色和蓝色背景。
    • 橙色背景表示模型猜测的病树位置。
    • 蓝色背景是模型对健康树木位置的猜测。 该模型的表现非常糟糕;大约一半的猜测都是错误的。
  • 由于 x1 的权重为 1.0,其他特征的权重为 0,因此模型与 x1 的值完全匹配。

任务 2:更改任意或全部三个特征的权重,使模型(背景颜色)能够成功预测病树和健康树。解决方案会显示在 Playground 下方。



练习 2:更复杂的特征组合

对于第二项练习,请查看输出模型中橙色点(病树)和蓝色点(健康树)的排列,并注意以下几点:

  • 这些点大致呈球形图案。
  • 点排列得比较杂乱;例如,请注意橙色点外球体中偶尔出现的蓝色点。因此,即使是出色的模型,也不太可能正确预测每个点。

任务 1:执行以下操作,探索 Playground 界面:

  1. 点击“运行/暂停”按钮,该按钮是一个黑色圆圈内的白色三角形。Playground 将开始训练模型;请注意“周期”计数器是否在增加。
  2. 在系统训练至少 300 个周期后,按同一“运行/暂停”按钮暂停训练。
  3. 查看模型。模型是否能做出良好的预测?换句话说,蓝点周围是否通常是蓝色背景,而橙点周围是否通常是橙色背景?
  4. 检查“OUTPUT”正下方的“Test loss”值。此值是更接近 1.0(损失较高)还是更接近 0(损失较低)?
  5. 按“跑/暂停”按钮左侧的弯曲箭头,重置“游乐场”。

任务 2:通过执行以下操作来构建更好的模型:

  1. 选择或取消选择五种可能的功能的任意组合。
  2. 调整学习速率。
  3. 至少训练 500 个周期。
  4. 检查测试损失的值。能否将测试损失降至 0.2 以下?

解决方案显示在 Playground 下方。