מניעת התאמה יתר
כמו בכל מודל אחר של למידת מכונה, אחד החששות העיקריים במהלך אימון של רשת נוירונים מסובכת הוא התאמה: מודל שספציפי מאוד לפרטי האימון, עד שאי אפשר להכליל לדוגמאות חדשות. יש שתי שיטות למניעת הימצאות יתר של רשתות CNN:
- שיפור נתונים: שיפור מלאכותי של הגיוון ומספר הדוגמאות לאימון על ידי ביצוע טרנספורמציות אקראיות לתמונות קיימות כדי ליצור קבוצה של וריאציות חדשות (ראו איור 7). הרחבת הנתונים שימושית במיוחד כשקבוצת נתוני האימון המקורית קטנה יחסית.
- שימו לב להפסקה: הסרה אקראית של יחידות מהרשת הנוירולוגית במהלך שלב מעבר.
איור 7. הגדלת נתונים על תמונה יחידה של כלב (מצולמת ממערך הנתונים "dogs לעומת Cats" זמינה ב-Kaggle). שמאלה: תמונת כלב מקורית מקבוצת האימון. ימין: תשע תמונות חדשות שנוצרו מהתמונה המקורית באמצעות טרנספורמציות אקראיות.