Klasifikasi: Benar vs. Salah dan Positif vs. Negatif

Di bagian ini, kita akan menentukan elemen penyusun utama metrik yang akan kita gunakan untuk mengevaluasi model klasifikasi. Namun pertama-tama, baca dongeng:

A Fable Aesop: The Boy Who Cry Wolf (dikompresi)

Seorang bocah gembala merasa bosan merawat kawanan domba di kota. Untuk bersenang-senang, dia berteriak, "Wolf!" meskipun tidak ada serigala yang terlihat. Penduduk desa berlari untuk melindungi ternak, tetapi kemudian merasa kesal saat mengetahui bahwa anak laki-laki itu sedang bercanda.

[Iterasi paragraf sebelumnya N kali.]

Suatu malam, gembala gembala melihat serigala sungguhan mendekati kawanan dan berteriak, "Segala!" Penduduk desa menolak untuk tertipu dan tinggal di rumah mereka lagi. Serigala yang lapar mengubah kawanan domba menjadi daging domba. Kota ini lapar. dan terjadilah kepanikan.

Mari kita buat definisi berikut:

  • "Segala" adalah kelas positif.
  • "Tanpa serigala" adalah kelas negatif.

Kita dapat meringkas "prediksi serigala" model menggunakan matriks 2x2 matriks konfusi yang menggambarkan keempat hasil yang mungkin:

Positif Benar (TP):
  • Realitas: Serigala terancam.
  • Gembala berkata: "Segala."
  • Hasil: Shepherd adalah pahlawan.
Positif Palsu (PP):
  • Realitas: Tidak ada serigala yang terancam.
  • Gembala berkata: "Segala."
  • Hasil: Penduduk desa marah pada gembala karena membangunkan mereka.
Negatif Palsu (FN):
  • Realitas: Serigala terancam.
  • Gembala berkata: "Tidak ada serigala."
  • Hasil: Serigala memakan semua domba.
Negatif Benar (TN):
  • Realitas: Tidak ada serigala yang terancam.
  • Gembala berkata: "Tidak ada serigala."
  • Hasil: Semua baik-baik saja.

Positif benar adalah hasil jika model benar memprediksi class positif. Demikian pula, negatif benar adalah hasil jika model benar memprediksi class negatif.

Positif palsu (PP) adalah hasil jika model salah memprediksi class positif. Dan negatif palsu adalah hasil jika model salah memprediksi kelas negatif.

Di bagian berikut, kita akan melihat cara mengevaluasi model klasifikasi menggunakan metrik yang berasal dari keempat hasil tersebut.