Regresi linear: Kerugian

Kehilangan adalah metrik numerik yang menjelaskan seberapa salah prediksi model alamat IP internalnya. Kerugian mengukur jarak antara prediksi model dan prediksi label. Tujuan melatih model adalah untuk meminimalkan kerugian, menguranginya yang serendah mungkin.

Pada gambar berikut, Anda dapat memvisualisasikan kerugian sebagai panah yang diambil dari data mengarah ke model. Panah menunjukkan seberapa jauh prediksi model dari nilai sebenarnya.

Gambar 9. Garis kehilangan menghubungkan 
titik data ke
model transformer.

Gambar 9. Kerugian diukur dari nilai aktual hingga nilai prediksi.

Jarak kerugian

Dalam statistik dan machine learning, kerugian mengukur perbedaan antara nilai aktual dan prediksi. Kerugian berfokus pada jarak antar nilai, bukan arahnya. Misalnya, jika model memprediksi 2, tetapi nilai sebenarnya adalah 5, kita tidak peduli jika kerugiannya negatif $ -3 $ ($ 2-5=-3 $). Sebagai gantinya, kita peduli bahwa jarak antarnilai adalah $ 3 $. Dengan demikian, semua metode untuk menghitung kerugian menghapus tanda itu.

Dua metode yang paling umum untuk menghapus tanda adalah sebagai berikut:

  • Ambil nilai absolut dari selisih antara nilai sebenarnya dan prediksi.
  • Kuadratkan selisih antara nilai sebenarnya dan prediksi.

Jenis kerugian

Dalam regresi linier, ada empat jenis kerugian utama, yang diuraikan dalam pada tabel berikut.

Jenis kehilangan Definisi Persamaan
Penurunan1 Jumlah nilai absolut dari selisih antara nilai yang diprediksi dan nilai sebenarnya. $ ∑ | nilai aktual\ - nilai\ yang diprediksi | Rp
Rata-rata error absolut (MAE) Rata-rata kerugian L1 di sekumpulan contoh. $ \frac{1}{N} ∑ | nilai aktual\ - nilai\ yang diprediksi | Rp
K2 kalah Jumlah selisih kuadrat antara nilai yang diprediksi dan nilai sebenarnya. $ ∑(nilai aktual\ - nilai\ prediksi)^2 $
Rata-rata error kuadrat (MSE) Rata-rata kerugian L2 di sekumpulan contoh. $ \frac{1}{N} ∑ (nilai\aktual\ - nilai\ terprediksi)^2 $

Perbedaan fungsional antara kerugian L1 dan kerugian L2 (atau antara MAE dan MSE) adalah kuadrat. Ketika perbedaan antara prediksi dan labelnya besar, pengkuadrat membuat kerugian semakin besar. Jika perbedaannya kecil (kurang dari 1), mengkuadratkan membuat kerugian semakin kecil.

Saat memproses beberapa contoh sekaligus, sebaiknya Anda menghitung rata-rata kerugian di semua contoh, baik menggunakan MAE atau MSE.

Contoh menghitung kerugian

Menggunakan garis yang paling sesuai sebelumnya, kita akan menghitung kerugian L2 untuk satu contoh. Dari garis yang paling sesuai, kita memiliki nilai berikut untuk bobot dan bias:

  • $ \small{Berat: -3,6} $
  • $ \small{Bias: 30} $

Jika model itu memprediksi bahwa mobil seberat 2.370 pon menjadi 21,5 mil per galon, tetapi yang sebenarnya mendapatkan 24 mil per galon, kita hitung kerugian L2 sebagai berikut ini:

Nilai Persamaan Hasil
Prediksi

$\small{bias + (bobot * fitur\ nilai)}$

$\small{30 + (-3,6*2,37)}$

$\small{21,5}$
Nilai sebenarnya $ \small{ label } $ $ \small{ 24 } $
Kerugian L2

$ \small{ (prediksi - nilai\aktual)^2} $

$\small{ (21,5 - 24)^2 }$

$\small{6,25}$

Dalam contoh ini, kerugian L2 untuk titik data tunggal tersebut adalah 6,25.

Memilih kerugian

Memutuskan apakah akan menggunakan MAE atau MSE dapat tergantung pada {i>dataset<i} dan cara Anda ingin menangani prediksi tertentu. Sebagian besar nilai fitur dalam set data biasanya berada dalam rentang yang berbeda. Misalnya, mobil biasanya antara tahun 2000 dan 5000 pound dan mendapatkan antara 8 hingga 50 mil per galon. Sebuah mobil seberat 8.000 pon, atau mobil yang mencapai 100 mil per galon, berada di luar jangkauan biasanya dan akan dianggap sebagai outlier.

{i>Outlier <i}juga dapat mengacu pada seberapa jauh prediksi model dari masing-masing. Misalnya, mobil seberat 3.000 pound atau mobil yang mencapai 40 mil per galon berada dalam rentang standar. Namun, mobil seberat 3.000 pon 40 mil per galon akan menjadi pencilan dalam hal prediksi model karena model itu akan memprediksi bahwa mobil seberat 3.000 pon akan berjalan antara 18 dan 20 mil per galon.

Saat memilih fungsi kerugian terbaik, pertimbangkan bagaimana Anda ingin model memperlakukan yang berbeda. Misalnya, MSE menggerakkan model lebih ke arah pencilan, sementara MAE tidak. Kerugian L2 menimbulkan penalti yang jauh lebih tinggi untuk pencilan daripada Kerugian L1. Misalnya, gambar berikut menunjukkan model yang dilatih menggunakan MAE dan model yang dilatih menggunakan MSE. Garis merah mewakili terlatih yang akan digunakan untuk membuat prediksi. {i>Outlier <i}lebih dekat dengan model yang dilatih dengan MSE daripada model yang dilatih dengan MAE.

Gambar 10. Model ini lebih miring ke arah pencilan.

Gambar 10. Model yang dilatih dengan MSE memindahkan model lebih dekat ke pencilan.

Gambar 11. Model ini miring lebih jauh dari pencilan.

Gambar 11. Model yang dilatih dengan MAE lebih jauh dari pencilan.

Perhatikan hubungan antara model dan data:

  • MSE. Model ini lebih dekat dengan pencilan, tetapi lebih jauh dari sebagian besar titik data lainnya.

  • MAE. Model ini lebih jauh dari pencilan (outlier), tetapi lebih mendekati ke sebagian besar data titik data lainnya.

Memeriksa Pemahaman Anda

Pertimbangkan dua plot berikut:

Plot berisi 10 poin.
      Sebuah garis melintasi 6 titik. 2 poin adalah 1 unit
      di atas garis; 2 titik lainnya berada 1 unit di bawah garis. Plot berisi 10 poin. Satu baris berjalan
      hingga 8 poin. 1 poin adalah 2 unit
      di atas garis; 1 titik lainnya berjarak 2 satuan di bawah garis.
Manakah dari dua {i>dataset <i}yang ditunjukkan pada plot sebelumnya memiliki Error Kuadrat Rata-Rata (RKG) lebih tinggi?
Set data di sebelah kiri.
Enam contoh pada baris menimbulkan total kerugian 0. Keempat contoh yang berbeda tidak terlalu jauh dari garis, sehingga mengkuadratkan offset mereka masih menghasilkan nilai rendah: $MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0,4$
Set data di sebelah kanan.
Delapan contoh pada baris menimbulkan total kerugian 0. Namun, meskipun hanya dua poin yang melanggar, keduanya titik dua kali lebih jauh dari garis karena titik pencilan pada gambar di kiri. Kerugian kuadrat memperkuat perbedaan tersebut, jadi kompensasi dua menimbulkan kerugian empat kali lebih besar dari satu: $MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0,8$