Halaman ini diterjemahkan oleh Cloud Translation API.

Overfitting: Menafsirkan kurva kerugian

Machine learning akan jauh lebih sederhana jika semua kurva kerugian terlihat seperti ini saat pertama kali Anda melatih model:

Gambar 20. Plot yang menunjukkan kurva kerugian ideal saat melatih
model machine learning. Kurva kerugian memetakan kerugian pada sumbu y
terhadap jumlah langkah pelatihan pada sumbu x. Seiring meningkatnya jumlah langkah pelatihan, kerugian mulai tinggi, lalu menurun secara eksponensial, dan pada akhirnya menjadi datar untuk mencapai kerugian minimum. — **Gambar 20.** Kurva kerugian yang ideal.

Sayangnya, kurva kerugian sering kali sulit ditafsirkan. Gunakan intuisi Anda tentang kurva kerugian untuk menyelesaikan latihan di halaman ini.

Latihan 1: Kurva kerugian berosilasi

Gambar 21. Kurva kerugian (kerugian pada sumbu y; jumlah langkah pelatihan
pada sumbu x) yang kerugiannya tidak datar.
Sebaliknya, kerugian berosilasi secara tidak teratur. — **Gambar 21.** Kurva kerugian yang berosilasi.

Tiga hal apa yang dapat Anda lakukan untuk mencoba meningkatkan kurva kerugian yang ditampilkan dalam Gambar 21.

Periksa data Anda dengan skema data untuk mendeteksi contoh yang buruk, lalu hapus contoh yang buruk dari set pelatihan.

Ya, ini adalah praktik yang baik untuk semua model.

Kurangi kecepatan pembelajaran.

Ya, mengurangi kecepatan belajar sering kali merupakan ide yang baik saat men-debug masalah pelatihan.

Kurangi set pelatihan menjadi sejumlah kecil contoh yang tepercaya.

Meskipun teknik ini terdengar artifisial, sebenarnya ini adalah ide yang baik. Dengan asumsi bahwa model berkonvergensi pada sekumpulan contoh tepercaya yang kecil, Anda dapat menambahkan lebih banyak contoh secara bertahap, mungkin menemukan contoh mana yang menyebabkan kurva kerugian berosilasi.

Tingkatkan jumlah contoh dalam set pelatihan.

Ini adalah ide yang menarik, tetapi sangat tidak mungkin memperbaiki masalah.

Tingkatkan kecepatan pembelajaran.

Secara umum, hindari meningkatkan kecepatan pembelajaran saat kurva pembelajaran model menunjukkan masalah.

Latihan 2. Kurva kerugian dengan lonjakan tajam

Gambar 22. Plot kurva kerugian yang menunjukkan penurunan kerugian hingga
sejumlah langkah pelatihan tertentu, lalu tiba-tiba meningkat
dengan langkah pelatihan lebih lanjut. — **Gambar 22.** Peningkatan kerugian yang signifikan.

Dua pernyataan manakah dari pernyataan berikut yang mengidentifikasi kemungkinan alasan terjadinya ledakan kerugian yang ditunjukkan pada Gambar 22.

Data input berisi satu atau beberapa NaN—misalnya, nilai yang disebabkan oleh pembagian dengan nol.

Hal ini lebih sering terjadi daripada yang Anda kira.

Data input berisi sekelompok outlier.

Terkadang, karena pengacakan batch yang tidak tepat, batch mungkin berisi banyak pencilan.

Kecepatan pembelajaran terlalu rendah.

Kecepatan pembelajaran yang sangat rendah dapat meningkatkan waktu pelatihan, tetapi bukan penyebab kurva kerugian yang aneh.

Rasio regularisasi terlalu tinggi.

Benar, regularisasi yang sangat tinggi dapat mencegah model berkonvergensi; tetapi, hal ini tidak akan menyebabkan kurva loss yang aneh yang ditampilkan dalam Gambar 22.