Praktik ML: Klasifikasi Gambar

Mencegah Overfitting

Seperti model machine learning lainnya, masalah utama saat melatih jaringan saraf konvolusi adalah overfitting: model yang sangat disesuaikan dengan detail data pelatihan sehingga tidak dapat digeneralisasi ke contoh baru. Dua teknik untuk mencegah overfitting saat membuat CNN adalah:

  • Augmentasi data: meningkatkan keberagaman dan jumlah contoh pelatihan secara artifisial dengan melakukan transformasi acak pada gambar yang ada untuk membuat kumpulan varian baru (lihat Gambar 7). Augmentasi data sangat berguna jika set data pelatihan asli relatif kecil.
  • Regularisasi dengan pelolosan: Menghapus unit secara acak dari jaringan neural selama langkah gradien pelatihan.

Diagram augmentasi data pada satu gambar, yang menghasilkan 9 gambar baru melalui
transformasi acak Gambar 7. Augmentasi data pada satu gambar (diambil dari set data" vs. Kucing" yang tersedia di Kaggle). Kiri: Gambar asli dari set pelatihan. Kanan: Sembilan gambar baru yang dihasilkan dari gambar asli menggunakan transformasi acak.