您可以调试机器学习模型,使其正常运行。模型正常运行后,您便可以提高模型的质量,以做好生产准备。本部分将介绍调试和优化步骤。
机器学习调试有何不同?
在深入了解机器学习调试之前,我们了解调试机器学习模型与调试典型程序的不同之处。与典型程序不同,机器学习模型的质量不佳并不意味着存在 bug。相反,为了调试模型中的性能不佳问题,您可以调查更广泛的原因,而不是传统编程。
例如,以下是导致模型性能不佳的一些原因:
- 功能缺乏预测能力。
- 超参数设置为非最佳值。
- 数据包含错误和异常情况。
- 特征工程代码包含 bug。
根据运行实验所需的时间来调试机器学习模型非常复杂。鉴于迭代周期更长、错误空间更大,调试机器学习模型并非易事。
机器学习模型开发流程
如果您遵循了开发机器学习模型的最佳做法,那么调试机器学习模型就会更简单。这些最佳做法如下:
- 从使用一两个特征的简单模型开始。从简单且可调试的模型开始,您可以缩小导致模型性能不佳的多种可能原因的范围。
- 尝试使用不同的特征和超参数值,让模型正常运行。尽可能简化模型以简化调试。
- 通过反复尝试以下更改来优化模型:
- 添加功能
- 调节超参数
- 增加模型容量
- 每次更改模型后,请再次访问指标并检查模型质量是否提高。否则,请按照本课程中的说明调试您的模型。
- 在迭代过程中,请确保慢慢地逐步增加模型的复杂性。