生产型机器学习系统：静态推理与动态推理

推理是指通过将训练后的模型应用于无标签示例做出预测的过程。一般来说，模型可以通过以下两种方式之一推断预测结果：

举个极端的例子，假设有一个非常复杂的模型，需要 1 小时才能推理出预测结果。这可能非常适合使用静态推理：

假设这个复杂模型错误地使用了动态推理而非静态推理。如果许多客户端在同一时间请求预测，其中大多数客户端将在数小时或数天后才能收到该预测。

现在，假设有一个模型可以快速推理，可能只需 2 毫秒，并且使用相对最少的计算资源。在这种情况下，客户端可以通过动态推理快速高效地接收预测结果，如图 5 所示。

静态推理

静态推理具有一定的优势和缺点。

优势

缺点

动态推理具有一定的优势和劣势。

优势

缺点

以下四个陈述中，哪三个对静态推理来说是正确的？

模型必须为所有可能的输入创建预测。

是的，模型必须针对所有可能的输入进行预测，并将其存储在缓存或查找表中。如果模型要预测的事物集合是有限的，则静态推理可能是一个不错的选择。不过，对于包含大量不常见或罕见项的自由形式输入（例如用户查询），静态推理无法提供完整覆盖。

系统可以在投放推理出的预测结果之前对其进行验证。

是，这是静态推理的有用方面。

对于给定的输入，模型可以比动态推理更快地提供预测。

是的，静态推理几乎总是比动态推理更快地提供预测。

您可以快速应对世界形势的变化。

不可以，这是静态推理的缺点。

以下哪个关于动态推理的表述是正确的？

您可以为所有可能的条目提供预测。

是的，这是动态推理的优势。系统会为收到的任何请求分配一个得分。动态推理可处理长尾分布（包含许多稀有项的分布），例如电影评论中所有可能的句子的空间。

您可以在使用预测结果之前对其进行后验证。

通常，由于预测是按需进行的，因此无法在使用之前对所有预测进行后验证。不过，您或许可以监控汇总预测质量，以提供一定程度的质量检查，但这些检查只能在火势蔓延后发出火警。

执行动态推理时，您无需像执行静态推理时那样担心预测延迟时间（返回预测结果的延迟时间）。

在动态推理中，预测延迟时间通常是一个真正的问题。很遗憾，添加更多推理服务器并不一定能解决预测延迟问题。