In questa sezione, definiremo i componenti di base principali delle metriche che utilizzeremo per valutare i modelli di classificazione. Ma prima, una favola:
La fiaba di Esopo: Il ragazzo che piangeva il lupo (compresso)
Un pastore si annoia a prendersi cura del gregge della città. Per divertirsi, piange "Lupo!" anche se non è in vista un lupo. Gli abitanti del villaggio corrono per proteggere il gregge, ma poi si innervosiscono molto quando si rendono conto che il bambino stava giocando a loro con una barzelletta.
[Ripetere il paragrafo precedente N volte.]
Una notte, il pastore vede un vero lupo che si avvicina al gregge e dice: "Lupo!" Gli abitanti del villaggio si rifiutano di essere ingannati e rimangono nelle loro case. Il lupo affamato trasforma il gregge in costolette di agnello. La città soffre la fame. Il panico.
Eseguiamo le seguenti definizioni:
- "Wolf" è una classe positiva.
- "No wolf" è una classe negativa.
Possiamo riepilogare il nostro modello "previsione del lupo" utilizzando una matrice di confusione 2 x 2 che rappresenta tutti e quattro i possibili risultati:
Vero positivo (TP):
|
Falso positivo (FP):
|
Falso negative (FN):
|
Vero negativo (TN):
|
Un vero positivo è un risultato in cui il modello prevede correttamente la classe positiva. Analogamente, un vero negativo è un risultato in cui il modello prevede correttamente la classe negativa.
Un falso positivo è un risultato in cui il modello prevede in modo errato la classe positiva. Un falso negativo è un risultato in cui il modello prevede in modo errato la classe negativa.
Nelle sezioni seguenti, vedremo come valutare i modelli di classificazione utilizzando le metriche derivate da questi quattro risultati.