Klasifikasi: Nilai minimum

Regresi logistik menampilkan probabilitas. Anda dapat menggunakan probabilitas yang ditampilkan "sebagaimana" (misalnya, probabilitas bahwa pengguna akan mengklik iklan ini adalah 0,00023) atau mengonversi probabilitas yang ditampilkan ke nilai biner (misalnya, email ini adalah spam).

Model regresi logistik yang menampilkan 0,9995 untuk pesan email tertentu memprediksi bahwa kemungkinan besar itu adalah spam. Sebaliknya, pesan email lain dengan skor prediksi 0,0003 pada model regresi logistik yang sama kemungkinan besar bukan spam. Namun, bagaimana dengan pesan email dengan skor prediksi 0,6? Untuk memetakan nilai regresi logistik ke kategori biner, Anda harus menentukan batas klasifikasi (juga disebut nilai minimum keputusan). Nilai di atas batas tersebut menunjukkan "spam"; nilai di bawah mengindikasikan "bukan spam." Anda mungkin ingin berasumsi bahwa batas klasifikasi harus selalu 0,5, tetapi batas tersebut bergantung pada masalah, dan oleh karena itu, Anda harus menyesuaikan nilai.

Bagian berikut ini membahas lebih lanjut metrik yang dapat Anda gunakan untuk mengevaluasi prediksi model klasifikasi, serta dampak dari mengubah batas klasifikasi pada prediksi ini.