Halaman ini diterjemahkan oleh Cloud Translation API.

Regresi linear: Kerugian

Loss adalah metrik numerik yang menjelaskan seberapa salah prediksi model. Loss mengukur jarak antara prediksi model dan label sebenarnya. Tujuan melatih model adalah untuk meminimalkan kerugian, dengan menurunkannya ke nilai serendah mungkin.

Pada gambar berikut, Anda dapat memvisualisasikan kerugian sebagai panah yang ditarik dari titik data ke model. Panah menunjukkan seberapa jauh prediksi model dari nilai sebenarnya.

Gambar 8. Garis kerugian menghubungkan titik data ke model.

Gambar 8. Loss diukur dari nilai aktual ke nilai prediksi.

Jarak kehilangan

Dalam statistik dan machine learning, kerugian mengukur perbedaan antara nilai prediksi dan nilai aktual. Loss berfokus pada jarak antara nilai, bukan arah. Misalnya, jika model memprediksi 2, tetapi nilai sebenarnya adalah 5, kita tidak peduli bahwa kerugiannya negatif (2 – 5= –3). Sebaliknya, kita peduli bahwa jarak antara nilai adalah 3. Dengan demikian, semua metode untuk menghitung kerugian menghapus tanda.

Dua metode paling umum untuk menghapus tanda tersebut adalah sebagai berikut:

Ambil nilai absolut dari perbedaan antara nilai aktual dan prediksi.
Kuadratkan perbedaan antara nilai aktual dan prediksi.

Jenis kehilangan

Dalam regresi linear, ada lima jenis kerugian utama, yang diuraikan dalam tabel berikut.

Jenis kehilangan	Definisi	Persamaan
L₁ loss	Jumlah nilai absolut dari perbedaan antara nilai prediksi dan nilai aktual.	$ ∑ \| nilai\ sebenarnya - nilai\ yang\ diprediksi \| $
Rata-rata error absolut (MAE)	Rata-rata kerugian L₁ di seluruh set N contoh.	$ \frac{1}{N} ∑ \| nilai\ sebenarnya - nilai\ prediksi \| $
L₂ loss	Jumlah perbedaan kuadrat antara nilai prediksi dan nilai aktual.	$ ∑(nilai\ aktual - nilai\ prediksi)^2 $
Rataan kuadrat galat (MSE)	Rata-rata kerugian L₂ di seluruh set N contoh.	$ \frac{1}{N} ∑ (nilai\ sebenarnya - nilai\ prediksi)^2 $
Error akar rataan kuadrat (RMSE)	Akar kuadrat dari rataan kuadrat galat (MSE).	$ \sqrt{\frac{1}{N} ∑ (nilai\ aktual - nilai\ prediksi)^2} $

Perbedaan fungsional antara kerugian L₁ dan kerugian L₂ (atau antara MAE/RMSE dan MSE) adalah penguadratan. Jika perbedaan antara prediksi dan label besar, penguadratan akan membuat kerugian menjadi lebih besar. Jika perbedaannya kecil (kurang dari 1), penguadratan akan membuat kerugian menjadi lebih kecil.

Metrik kerugian seperti MAE dan RMSE mungkin lebih disukai daripada kerugian L₂ atau MSE dalam beberapa kasus penggunaan karena cenderung lebih mudah ditafsirkan oleh manusia, karena mengukur error menggunakan skala yang sama dengan nilai prediksi model.

Saat memproses beberapa contoh sekaligus, sebaiknya hitung rata-rata kerugian di semua contoh, baik menggunakan MAE, MSE, atau RMSE.

Contoh penghitungan kerugian

Di bagian sebelumnya, kita membuat model berikut untuk memprediksi efisiensi bahan bakar berdasarkan berat mobil:

Model: $ y' = 34 + (-4.6)(x_1) $
- Berat: $ –4,6 $
- Bias: $ 34 $

Jika model memprediksi bahwa mobil seberat 2.370 pound mendapatkan 23,1 mil per galon, tetapi sebenarnya mendapatkan 24 mil per galon, kita akan menghitung kerugian L₂ sebagai berikut:

Nilai	Persamaan	Hasil
Prediksi	$\small{bias + (bobot * nilai\ fitur)}$ $\small{34 + (-4.6*2.37)}$	$\small{23.1}$
Nilai sebenarnya	$ \small{ label } $	$ \small{ 24 } $
Kerugian L₂	$ \small{ (nilai\ sebenarnya - nilai\ prediksi)^2 } $ $\small{ (24 - 23,1)^2 }$	$\small{0.81}$

Nilai

Persamaan

Hasil

Prediksi

$\small{bias + (bobot * nilai\ fitur)}$

$\small{34 + (-4.6*2.37)}$

$\small{23.1}$

Nilai sebenarnya

$ \small{ label } $

$ \small{ 24 } $

Kerugian L₂

$ \small{ (nilai\ sebenarnya - nilai\ prediksi)^2 } $

$\small{ (24 - 23,1)^2 }$

$\small{0.81}$

Dalam contoh ini, kerugian L₂ untuk satu titik data tersebut adalah 0,81.

Memilih kerugian

Keputusan untuk menggunakan MAE atau MSE dapat bergantung pada set data dan cara Anda ingin menangani prediksi tertentu. Sebagian besar nilai fitur dalam set data biasanya berada dalam rentang yang berbeda. Misalnya, mobil biasanya memiliki berat antara 2.000 dan 5.000 pon serta mendapatkan 8 hingga 50 mil per galon. Mobil seberat 3.600 kg, atau mobil yang menempuh 100 mil per galon, berada di luar rentang umum dan akan dianggap sebagai pencilan.

Pencilan juga dapat merujuk pada seberapa jauh prediksi model dari nilai sebenarnya. Misalnya, 3.000 pon berada dalam rentang berat mobil standar, dan 40 mil per galon berada dalam rentang efisiensi bahan bakar standar. Namun, mobil seberat 3.000 pound yang memiliki efisiensi bahan bakar 40 mil per galon akan menjadi pencilan dalam hal prediksi model karena model akan memprediksi bahwa mobil seberat 3.000 pound akan memiliki efisiensi bahan bakar sekitar 20 mil per galon.

Saat memilih fungsi kerugian terbaik, pertimbangkan cara yang Anda inginkan agar model memperlakukan pencilan. Misalnya, MSE menggerakkan model lebih ke arah pencilan, sedangkan MAE tidak. Kerugian L₂ menimbulkan penalti yang jauh lebih tinggi untuk pencilan daripada kerugian L₁. Misalnya, gambar berikut menunjukkan model yang dilatih menggunakan MAE dan model yang dilatih menggunakan MSE. Garis merah mewakili model terlatih sepenuhnya yang akan digunakan untuk membuat prediksi. Pencilan lebih dekat dengan model yang dilatih dengan MSE daripada model yang dilatih dengan MAE.

Gambar 9. Model lebih cenderung ke pencilan.

Gambar 9. Kerugian MSE membuat model lebih dekat dengan pencilan.

Gambar 10. Model dimiringkan lebih jauh dari pencilan.

Gambar 10. Kerugian MAE membuat model lebih jauh dari pencilan.

Perhatikan hubungan antara model dan data:

MSE. Model lebih dekat dengan pencilan, tetapi lebih jauh dari sebagian besar titik data lainnya.
MAE. Model ini lebih jauh dari pencilan, tetapi lebih dekat dengan sebagian besar titik data lainnya.

Klik ikon untuk mengetahui panduan selengkapnya tentang memilih metrik kerugian

Pilih MSE:

Jika Anda ingin menghukum berat kesalahan besar.
Jika Anda yakin bahwa pencilan penting dan menunjukkan variasi data yang sebenarnya yang harus diperhitungkan oleh model.

Pilih MAE:

Jika set data Anda memiliki pencilan signifikan yang tidak ingin Anda terlalu memengaruhi model. MAE lebih kuat.
Jika Anda lebih memilih fungsi kerugian yang dapat ditafsirkan secara lebih langsung sebagai besarnya error rata-rata.

Dalam praktiknya, pilihan metrik Anda juga dapat bergantung pada masalah bisnis tertentu dan jenis kesalahan yang lebih merugikan.

Periksa Pemahaman Anda

Pertimbangkan dua plot berikut dari kecocokan model linear dengan set data:

Plot berisi 10 titik.
Garis melewati 6 titik. 2 titik berjarak 1 unit
di atas garis; 2 titik lainnya berjarak 1 unit di bawah garis.

Plot berisi 10 titik. Garis melewati
8 titik. 1 titik berjarak 2 unit
di atas garis; 1 titik lainnya berjarak 2 unit di bawah garis.

Manakah dari dua model linear yang ditampilkan dalam plot sebelumnya yang memiliki Rataan Kuadrat Galat (RKG) lebih tinggi saat dievaluasi pada titik data yang diplot?

Model di sebelah kiri.

Enam contoh pada garis tersebut mengalami total kerugian 0. Keempat contoh yang tidak berada pada garis terletak tidak terlalu jauh dari garis, sehingga meski mengkuadratkan offset mereka akan tetap menghasilkan nilai yang rendah: $RKG = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0,4$

Model di sebelah kanan.

Delapan contoh pada garis tersebut mengalami total kerugian 0. Namun, meskipun hanya dua poin yang berada di luar garis, kedua titik tersebut dua kali lebih jauh dari garis karena titik pencilan di figur kiri. Kerugian kuadrat memperbesar perbedaan tersebut, sehingga offset dua menimbulkan kerugian empat kali lebih besar daripada offset satu: $RKG = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0,8$

Sebelumnya

Regresi linear (10 mnt)

Berikutnya

Latihan interaktif: Parameter (5 menit)