在本部分中,我们将定义用于评估分类模型的指标的主要构建块。不过,我们先来看一则寓言故事:
伊索寓言:狼来了(压缩)
看着小镇的羊群牧童时,会感到无聊。为了找点乐子,他大声喊着“狼来了!”,即使眼前没有狼。村民们迅速跑来保护羊群,但他们发现这个家伙正在开玩笑后非常生气。
[重复上一段落 N 次。]
一天晚上,牧童看到真的有一头狼靠近羊群,他大声呼喊着“狼来了!”。村民们不想再上当受骗,只待待在家里。饥饿的狼将羊群变成了羊排。镇子饿了。恐慌也随之而来。
让我们做出以下定义:
- “狼来了”是正类别。
- "无狼”属于负类别。
我们可以使用一个 2x2 混淆矩阵来总结“狼预测”模型,该矩阵描述了所有可能出现的结果(共四种):
真正例 (TP):
|
假正例 (FP):
|
假负例 (FN):
|
真负例 (TN):
|
真正例是指模型正确预测正类别的结果。同样,真负例是指模型正确地预测出负类别。
假正例是指模型错误地预测正类别。假负例是指模型错误地预测负类别。
在以下部分中,我们将介绍如何使用从这四个结果中获取的指标来评估分类模型。