Classification: Vrai ou faux, et positif ou négatif

Dans cette section, nous allons définir les principaux composants des métriques que nous utiliserons pour évaluer les modèles de classification. Mais d'abord une fable:

La Fable d'Ésope: Le roi des loups (comprimé)

Un berger s'ennuie s'ennuyant à s'occuper du troupeau de la ville. Pour s'amuser, il crie "Au loup !". Les villageois courent pour protéger le troupeau, mais ils deviennent très énervés lorsqu'ils se rendent compte que le garçon leur a fait une blague.

[Recommencez le paragraphe précédent N fois.]

Un soir, le berger aperçoit un vrai loup s'approcher de son troupeau et crie "Au loup !". Les villageois refusent de se laisser berner et restent chez eux. Le loup affamé transforme le troupeau en côtelettes d'agneau. La ville a faim. S'ensuit une panique.

Étudions les définitions suivantes:

  • "Loup" est une classe positive.
  • "Aucun loup" est une classe négative.

Nous pouvons résumer notre modèle de "prédiction de loup" à l'aide d'une matrice de confusion 2x2 qui décrit les quatre résultats possibles:

Vrai positif (VP):
  • Réalité: un loup est menacé.
  • Berger a dit : "Loup".
  • Résultat: le berger est un héros.
Faux positif (FP):
  • Réalité: aucun loup menacé.
  • Berger a dit : "Loup".
  • Résultat: les villageois sont en colère contre les bergers qui les ont réveillés.
Faux négatif (FN):
  • Réalité: un loup est menacé.
  • Berger a dit : "Pas de loup".
  • Résultat: le loup dévore tous les moutons.
Vrai négatif (VN):
  • Réalité: aucun loup menacé.
  • Berger a dit : "Pas de loup".
  • Résultat: tout le monde va bien.

Un vrai positif est un résultat où le modèle prédit correctement la classe positive. De même, un vrai négatif est un résultat où le modèle prédit correctement la classe négative.

Un faux positif est un résultat où le modèle prédit incorrectement la classe positive. Et un faux négatif est un résultat où le modèle prédit de manière incorrecte la classe négative.

Dans les sections suivantes, nous allons voir comment évaluer les modèles de classification à l'aide de métriques issues de ces quatre résultats.