分类:正误分类和正分类与负分类

在本部分中,我们将定义用于评估分类模型的指标的主要构建块。不过,我们先来看一则寓言故事:

伊索寓言:狼来了(压缩

看着小镇的羊群牧童时,会感到无聊。为了找点乐子,他大声喊着“狼来了!”,即使眼前没有狼。村民们迅速跑来保护羊群,但他们发现这个家伙正在开玩笑后非常生气。

[重复上一段落 N 次。]

一天晚上,牧童看到真的有一头狼靠近羊群,他大声呼喊着“狼来了!”。村民们不想再上当受骗,只待待在家里。饥饿的狼将羊群变成了羊排。镇子饿了。恐慌也随之而来。

让我们做出以下定义:

  • “狼来了”是正类别
  • "无狼”属于负类别

我们可以使用一个 2x2 混淆矩阵来总结“狼预测”模型,该矩阵描述了所有可能出现的结果(共四种):

真正例 (TP)
  • 真实情况:受到狼的威胁。
  • 牧童说:“狼”。
  • 结果:牧童是个英雄。
假正例 (FP)
  • 现实情况:没有受到狼的威胁。
  • 牧童说:“狼”。
  • 结果:村民们为牧羊人唤醒醒来而生气。
假负例 (FN)
  • 真实情况:受到狼的威胁。
  • 牧童说:“没有狼”。
  • 结果:狼吃掉了所有绵羊。
真负例 (TN)
  • 现实情况:没有受到狼的威胁。
  • 牧童说:“没有狼”。
  • 结果:所有人都没事。

真正例是指模型正确预测正类别的结果。同样,真负例是指模型正确地预测出负类别。

假正例是指模型错误地预测正类别假负例是指模型错误地预测负类别。

在以下部分中,我们将介绍如何使用从这四个结果中获取的指标来评估分类模型。