Nilai minimum dan matriks kebingungan

Misalnya, Anda memiliki model regresi logistik untuk deteksi email spam yang memprediksi nilai antara 0 dan 1, yang mewakili probabilitas bahwa email tertentu adalah spam. Prediksi 0,50 menunjukkan kemungkinan 50% bahwa email tersebut adalah spam, prediksi 0,75 menunjukkan kemungkinan 75% bahwa email tersebut adalah spam, dan seterusnya.

Anda ingin men-deploy model ini di aplikasi email untuk memfilter spam ke dalam folder email terpisah. Namun, untuk melakukannya, Anda perlu mengonversi output numerik mentah model (misalnya, 0.75) ke dalam salah satu dari dua kategori: "spam" atau "bukan spam".

Untuk melakukan konversi ini, Anda memilih probabilitas nilai minimum, yang disebut nilai minimum klasifikasi. Contoh dengan probabilitas di atas nilai minimum kemudian ditetapkan ke class positif, class yang Anda uji (di sini, spam). Contoh dengan probabilitas yang lebih rendah ditetapkan ke class negatif, class alternatif (di sini, not spam).

Klik di sini untuk mengetahui detail selengkapnya tentang nilai minimum klasifikasi

Anda mungkin bertanya-tanya: apa yang terjadi jika skor yang diprediksi sama dengan ambang batas klasifikasi (misalnya, skor 0,5 dengan ambang batas klasifikasi juga 0,5)? Penanganan untuk kasus ini bergantung pada implementasi tertentu yang dipilih untuk model klasifikasi. Library Keras memprediksi class negatif jika skor dan nilai minimum sama, tetapi alat/framework lain dapat menangani kasus ini secara berbeda.

Misalnya, model memberi skor satu email sebagai 0,99, yang memprediksi bahwa email tersebut memiliki peluang 99% untuk menjadi spam, dan email lain sebagai 0,51, yang memprediksi bahwa email tersebut memiliki peluang 51% untuk menjadi spam. Jika Anda menetapkan batas klasifikasi ke 0,5, model akan mengklasifikasikan kedua email sebagai spam. Jika Anda menetapkan nilai minimum ke 0,95, hanya email yang memiliki skor 0,99 yang akan diklasifikasikan sebagai spam.

Meskipun 0,5 mungkin tampak seperti nilai minimum intuitif, sebaiknya jangan gunakan nilai ini jika biaya satu jenis klasifikasi yang salah lebih besar daripada yang lain, atau jika class tidak seimbang. Jika hanya 0,01% email yang merupakan spam, atau jika salah memasukkan email yang sah lebih buruk daripada membiarkan spam masuk ke kotak masuk, menandai apa pun yang dianggap model setidaknya 50% kemungkinan spam sebagai spam akan menghasilkan hasil yang tidak diinginkan.

Confusion matrix

Skor probabilitas bukanlah kenyataan, atau kebenaran dasar. Ada empat kemungkinan hasil untuk setiap output dari pengklasifikasi biner. Untuk contoh pengklasifikasi spam, jika Anda menata kebenaran dasar sebagai kolom dan prediksi model sebagai baris, tabel berikut, yang disebut matriks kebingungan, adalah hasilnya:

	Positif sebenarnya	Negatif sebenarnya
Prediksi positif	Positif benar (PB): Email spam yang diklasifikasikan dengan benar sebagai email spam. Ini adalah pesan spam yang otomatis dikirim ke folder spam.	Positif palsu (PP): Email yang bukan spam salah diklasifikasikan sebagai spam. Ini adalah email sah yang berakhir di folder spam.
Prediksi negatif	Negatif palsu (NP): Email spam yang salah diklasifikasikan sebagai bukan spam. Ini adalah email spam yang tidak tertangkap oleh filter spam dan masuk ke kotak masuk.	Negatif benar (NB): Email bukan spam yang diklasifikasikan dengan benar sebagai bukan spam. Ini adalah email resmi yang dikirim langsung ke kotak masuk.

Perhatikan bahwa total di setiap baris memberikan semua prediksi positif (TP + FP) dan semua prediksi negatif (FN + TN), terlepas dari validitasnya. Sementara itu, total di setiap kolom memberikan semua positif sebenarnya (TP + FN) dan semua negatif sebenarnya (FP + TN) terlepas dari klasifikasi model.

Jika total positif sebenarnya tidak mendekati total negatif aktual, set data tersebut tidak seimbang. Contoh set data yang tidak seimbang mungkin berupa kumpulan ribuan foto awan, dengan jenis awan langka yang Anda minati, misalnya, awan volutus, hanya muncul beberapa kali.

Pengaruh nilai minimum pada positif dan negatif benar serta palsu

Nilai minimum yang berbeda biasanya menghasilkan jumlah positif benar dan palsu, serta negatif benar dan palsu yang berbeda. Video berikut menjelaskan mengapa hal ini terjadi.

Coba ubah sendiri nilai minimumnya.

Widget ini menyertakan tiga set data mainan:

Terpisah, dengan contoh positif dan contoh negatif umumnya dibedakan dengan baik, dengan sebagian besar contoh positif memiliki skor lebih tinggi daripada contoh negatif.
Tidak dipisahkan, dengan banyak contoh positif memiliki skor lebih rendah daripada contoh negatif, dan banyak contoh negatif memiliki skor lebih tinggi daripada contoh positif.
Tidak seimbang, hanya berisi beberapa contoh class positif.

Memeriksa pemahaman Anda

1. Bayangkan model klasifikasi phishing atau malware dengan situs phishing dan malware berada di kelas berlabel 1 (benar) dan situs yang tidak berbahaya berada di kelas berlabel 0 (salah). Model ini salah mengklasifikasikan situs yang sah sebagai malware. Disebut apakah hal ini?

Positif palsu

Contoh negatif (situs yang sah) telah salah diklasifikasikan sebagai contoh positif (situs malware).

Positif benar

Positif benar adalah situs malware yang diklasifikasikan dengan benar sebagai malware.

Negatif palsu

Negatif palsu adalah situs malware yang salah diklasifikasikan sebagai situs yang sah.

Negatif benar

Negatif benar adalah situs yang sah dan diklasifikasikan dengan benar sebagai situs yang sah.

2. Secara umum, apa yang terjadi pada jumlah positif palsu saat nilai minimum klasifikasi meningkat? Bagaimana dengan positif benar? Bereksperimenlah dengan penggeser di atas.

Positif benar dan positif palsu akan berkurang.

Seiring meningkatnya nilai minimum, model kemungkinan akan memprediksi lebih sedikit positif secara keseluruhan, baik benar maupun salah. Pengklasifikasi spam dengan nilai minimum 0,9999 hanya akan memberi label spam pada email jika menganggap kemungkinan klasifikasinya setidaknya 99,99%, yang berarti kemungkinan salah memberi label pada email yang sah sangat kecil, tetapi juga kemungkinan akan melewatkan email spam yang sebenarnya.

Positif benar dan positif palsu meningkat.

Dengan penggeser di atas, coba tetapkan nilai minimum ke 0,1, lalu tarik ke 0,9. Apa yang terjadi pada jumlah positif palsu dan positif benar?

Positif benar meningkat. Positif palsu berkurang.

Dengan penggeser di atas, coba tetapkan nilai minimum ke 0,1, lalu tarik ke 0,9. Apa yang terjadi pada jumlah positif palsu dan positif benar?

3. Secara umum, apa yang terjadi pada jumlah negatif palsu saat batas klasifikasi meningkat? Bagaimana dengan negatif benar? Bereksperimenlah dengan penggeser di atas.

Negatif benar dan negatif palsu meningkat.

Seiring peningkatan nilai minimum, model kemungkinan akan memprediksi lebih banyak negatif secara keseluruhan, baik benar maupun salah. Pada nilai minimum yang sangat tinggi, hampir semua email, baik spam maupun bukan spam, akan diklasifikasikan sebagai bukan spam.

Negatif benar dan negatif palsu menurun.

Dengan penggeser di atas, coba tetapkan nilai minimum ke 0,1, lalu tarik ke 0,9. Apa yang terjadi pada jumlah negatif palsu dan negatif benar?

Negatif benar meningkat. Negatif palsu berkurang.

Dengan menggunakan penggeser di atas, coba tetapkan nilai minimum ke 0,1, lalu tarik ke 0,9. Apa yang terjadi pada jumlah negatif palsu dan negatif benar?

Sebelumnya

Pengantar (3 menit)

Berikutnya

Akurasi, perolehan, presisi, dan metrik terkait (15 menit)

Nilai minimum dan matriks kebingungan Tetap teratur dengan koleksi Simpan dan kategorikan konten berdasarkan preferensi Anda.

Confusion matrix

Pengaruh nilai minimum pada positif dan negatif benar serta palsu

Memeriksa pemahaman Anda

Nilai minimum dan matriks kebingungan