生产机器学习系统:测试您的知识

  1. 您正在使用机器学习构建一个分类模型来预测独角兽外形。您的数据集详细列出了 10,000 次独角兽出现和 10,000 次非独角兽非外观。该数据集包含位置、时间、海拔、温度、湿度、树木覆盖率、是否出现彩虹以及其他几个特征。

    启动独角兽外观预测器后,您需要使用新数据重新训练,让模型保持最新状态。由于要收集的新数据太多,因此您需要对一段时间内的新数据进行采样,以限制训练数据。你还需要考虑独角兽的日常和每年外观。您会选择哪个时间段?

  2. 启动您的独角兽外观预测器。很好用!您去度假,三周后回来,发现模型质量明显下降。假设独角兽的行为在三周内不太可能发生显著变化。最可能的原因是什么?

  3. 您查看了模型对南极洲的预测,发现自从模型发布到生产环境后,模型在南极洲的预测一直很糟糕。以下哪项可能是问题的根源?

  4. 您的独角兽外观预测程序已经运行了一年。您已修正许多问题,质量现在也很高。不过,您注意到一个小问题,但这个问题一直存在。在市区,您的模型质量略有下降。原因可能是什么?

  5. 通过排查,您大幅度提高了独角兽模型的预测质量,结果使用量增加了十倍。然而,用户现在抱怨模型速度极慢;推理请求通常需要超过 30 秒才能返回预测。以下哪项更改有助于解决此问题?