分类数据:特征交叉练习

游乐场是 一种交互式应用程序,可让您操纵各种 训练和测试机器学习模型的各个方面。 借助 Playground,您可以选择特征并调整超参数, 然后探索您的选择对模型有何影响。

本页包含两个 Playground 练习。

练习 1:一个基本特征组合

在本练习中,重点关注 Playground 的以下部分 界面:

  • 在“特征”下方,请注意三个潜在的模型特征: <ph type="x-smartling-placeholder">
      </ph>
    • 1
    • 2
    • x1x2
  • 在“OUTPUT”下面,您会看到 和蓝点假设您正在看到一个方形的森林, 橙点表示生病的树的位置,蓝点表示生病的树的位置 健康树的位置
  • 在“FEATURES”(特征)和“OUTPUT”(输出)之间,如果您仔细观察,就会发现 虚线将每个特征与输出连接起来。 每条虚线的宽度表示目前关联的权重 每项功能。这些线条非常模糊, 都初始化为 0。随着体重的增加或减少 线条的粗细

任务 1:通过执行以下操作来探索 Playground:

  1. 点击连接特征 x1 与输出结果的虚线。 系统会显示一个弹出式窗口。
  2. 在弹出式窗口中,输入权重 1.0
  3. 按 Enter 键。

请注意以下几点:

  • x1 的虚线会随着权重的增加而变粗 从 0 到 1.0。
  • 系统现在会显示橙色和蓝色的背景。
    • 橙色背景是模型对生病树木的猜测 。
    • 蓝色背景是模型对健康树的猜测, 。 模型的表现非常糟糕;大约一半的模型的猜测结果是 错误。
  • 由于 x1 的权重为 1.0,其他特征的权重为 0, 该模型与 x1 的值完全匹配。

任务 2:更改三个特征中的任意一个或所有特征的权重,以便 模型(背景颜色)成功预测了疾病和健康 数据。该解决方案就显示在 Playground 下方。



练习 2:更复杂的特征组合

在第二个练习中,我们来看看橙点(生病的树)的排列方式 输出模型中的蓝点(健康树),可以看到以下内容:

  • 这些圆点形成了大致球形的图案。
  • 圆点的排列很嘈杂;例如,请注意,系统偶尔会显示 多个点。因此,即使是出色的模型, 则不太可能正确预测每个点。

任务 1:执行以下操作来探索 Playground 界面:

  1. 点击“运行/暂停”(Run/Pause) 按钮,该按钮为一个黑色圆圈内的白色三角形 圆圈。Playground 会开始训练模型;观察 周期计数器增加。
  2. 在系统训练至少 300 个周期后,按同样的 用于暂停训练的“运行/暂停”按钮。
  3. 查看模型。模型是否做出良好的预测?也就是说, 蓝点周围通常环绕着蓝色背景 通常周围环绕着橙色背景的橙点?
  4. 检查测试损失的值,该值显示在“输出”正下方。这是 值是接近 1.0(损失较大)还是接近 0(损失较小)呢?
  5. 按下 “运行/暂停”按钮。

任务 2:通过执行以下操作来构建更好的模型:

  1. 选择或取消选择五种可能特征的任意组合。
  2. 调整学习速率。
  3. 对系统至少训练 500 个周期。
  4. 检查测试损失的值。测试损失能否小于 0.2?

解决方案会显示在 Playground 下方。