جلوگیری از نصب بیش از حد
مانند هر مدل یادگیری ماشینی، یکی از نگرانی های کلیدی هنگام آموزش شبکه عصبی کانولوشن، بیش از حد برازش است: مدلی که به قدری با مشخصات داده های آموزشی تنظیم شده است که قادر به تعمیم آن به نمونه های جدید نیست. دو روش برای جلوگیری از نصب بیش از حد در هنگام ساخت CNN عبارتند از:
- تقویت داده ها : افزایش مصنوعی تنوع و تعداد نمونه های آموزشی با انجام تبدیل های تصادفی به تصاویر موجود برای ایجاد مجموعه ای از انواع جدید (شکل 7 را ببینید). افزایش داده ها به ویژه زمانی مفید است که مجموعه داده های آموزشی اصلی نسبتاً کوچک باشد.
- تنظیم حذف: حذف تصادفی واحدها از شبکه عصبی در طول یک مرحله گرادیان آموزشی.
شکل 7. افزایش داده ها در یک تصویر سگ منفرد (برگرفته از مجموعه داده "سگ ها در مقابل گربه ها" موجود در Kaggle). سمت چپ : تصویر سگ اصلی از مجموعه آموزشی. سمت راست : نه تصویر جدید از تصویر اصلی با استفاده از تبدیلهای تصادفی ایجاد شده است.