Mencegah Overfit
Seperti model machine learning lainnya, masalah utama saat melatih jaringan neural konvolusional adalah over Fitting: model yang sangat sesuai dengan spesifikasi data pelatihan sehingga tidak dapat menggeneralisasi ke contoh baru. Dua teknik untuk mencegah kelebihan ukuran saat membuat CNN adalah:
- Pembesaran data secara artifisial meningkatkan keragaman dan jumlah contoh pelatihan dengan menjalankan transformasi acak ke gambar yang ada untuk membuat serangkaian varian baru (lihat Gambar 7). Penambahan data sangat berguna jika set data pelatihan asli relatif kecil.
- Regulerisasi putus: Menghapus unit dari jaringan neural secara acak selama langkah gradien pelatihan.
Gambar 7. Pembesaran data pada gambar anjing tunggal (dikutip dari "Anjing vs. Kucing" set data yang tersedia di Kaggle). Kiri: Gambar anjing asli dari set pelatihan. Kanan: Sembilan gambar baru yang dihasilkan dari gambar asli menggunakan transformasi acak.