Seperti model machine learning lainnya, masalah utama saat melatih jaringan saraf
konvolusi adalah overfitting: model yang sangat disesuaikan dengan detail
data pelatihan sehingga tidak dapat digeneralisasi ke contoh baru. Dua teknik untuk
mencegah overfitting saat membuat CNN adalah:
Augmentasi data: meningkatkan keberagaman dan jumlah
contoh pelatihan secara artifisial dengan melakukan transformasi acak pada gambar yang ada untuk
membuat kumpulan varian baru (lihat Gambar 7). Augmentasi data sangat
berguna jika set data pelatihan asli relatif kecil.
Regularisasi dengan pelolosan: Menghapus unit secara acak dari jaringan neural selama langkah gradien pelatihan.
Gambar 7. Augmentasi data
pada satu gambar (diambil dari set data" vs. Kucing"
yang tersedia di Kaggle). Kiri: Gambar asli dari set pelatihan.
Kanan: Sembilan gambar baru yang dihasilkan dari gambar asli menggunakan transformasi
acak.
[null,null,["Terakhir diperbarui pada 2025-01-18 UTC."],[[["Overfitting in convolutional neural networks can be mitigated by using techniques like data augmentation and dropout regularization."],["Data augmentation involves creating variations of existing training images to increase dataset diversity and size, which is particularly helpful for smaller datasets."],["Dropout regularization randomly removes units during training to prevent the model from becoming overly specialized to the training data."],["When dealing with large datasets, the need for dropout regularization diminishes and the impact of data augmentation is reduced."]]],[]]