למידת מכונה הייתה הרבה יותר פשוטה אם עקומות הפסד כך נראה כך בפעם הראשונה שאימנתם את המודל:
לצערנו, קשה בדרך כלל לפרש את עקומות אובדן הנתונים. שימוש ב של עקומות אובדן כדי לפתור את התרגילים בדף הזה.
תרגיל 1: עקומת הפסדים מתנדנדת
אילו שלוש פעולות אפשר לעשות כדי לנסות לשפר את עקומת האובדן
שמוצגת באיור 21.
לבדוק את הנתונים שלכם מול סכימת נתונים כדי לזהות דוגמאות שגויות, וגם
ואז להסיר את הדוגמאות הגרועות מקבוצת האימון.
כן, שיטה זו מומלצת לכל המודלים.
הפחתת קצב הלמידה.
כן, הפחתת קצב הלמידה היא בדרך כלל רעיון טוב לניפוי באגים
בעיית אימון.
כדאי לצמצם את מספר האימון לדוגמאות מהימנות.
למרות שהשיטה הזו נשמעת מלאכותית, היא
כרעיון ראשי. בהנחה שהמודל מתכנס לקבוצה הקטנה של
אפשר להוסיף עוד דוגמאות בהדרגה,
אולי לגלות אילו דוגמאות גורמות לעקומת אובדן
לתנודה.
כדאי להגדיל את מספר הדוגמאות בערכת האימון.
זה רעיון מפתה, אבל קשה מאוד לפתור את הבעיה
את הבעיה.
להגביר את קצב הלמידה.
באופן כללי, לא כדאי להגביר את קצב הלמידה כשהמודל
עקומת הלמידה מצביעה על בעיה.
תרגיל 2. עקומת הפסדים עם קפיצה חדה
אילו שתי מההצהרות הבאות מזהות אפשרויות
סיבות לאובדן הפיצוץ שמוצג באיור 22.
נתוני הקלט מכילים מספר NaN אחד או יותר – לדוגמה,
נגרמה על ידי חילוק באפס.
התופעה הזו נפוצה יותר מהצפוי.
נתוני הקלט מכילים רצף של חריגים חשודי טעות.
לפעמים, עקב ערבוב לא תקין של קבוצות קבצים, ייתכן שאצווה
מכילים הרבה חריגים.
קצב הלמידה נמוך מדי.
קצב למידה נמוך מאוד עשוי להאריך את זמן האימון, אבל
לא הסיבה לעקומת האובדן המוזרה.
שיעור הרגולריזציה גבוה מדי.
נכון, רמה גבוהה מאוד של התאמה לשוק (regularization) עלולה למנוע מהמודל
converging; עם זאת, זה לא יגרום לעקומת אובדן מוזרה
שמוצגת באיור 22.
תרגיל 3. המשמעות של אובדן הבחינה בגלל אובדן האימון,
איזה אחת מההצהרות הבאות מזהה בצורה הטובה ביותר את
להבדל בין עקומות ההפסד של האימון.
ואת קבוצות הבדיקה?
המודל מתאים מדי לערכת האימון.
כן, סביר להניח שהיא לא אמיתית. פתרונות אפשריים:
- לפשט את המודל, כנראה על ידי הקטנת המספר של פיצ'רים.
- מגדילים את שיעור הרגולריזציה.
- מוודאים שמערכת האימון וערכת הבדיקה הן סטטיסטיות מקביל.
קצב הלמידה גבוה מדי.
אם קצב הלמידה גבוה מדי, אז עקומת ההפסד בקבוצת האימון.
סביר להניח שהוא לא היה מתנהג כמו שהוא התנהג.
תרגיל 4. עקומת אובדן נתונים נתקעת
איזו אחת מההצהרות הבאות היא בעלת הסבירות הגבוהה ביותר
הסבר על עקומת האובדן היציבה שמוצגת באיור 24?
ערכת האימון מכילה רצפים של דוגמאות שחוזרות על עצמן.
זו אפשרות. חשוב לוודא שהדוגמאות בסדר אקראי
במידה מספקת.
שיעור הרגולריזציה גבוה מדי.
לא סביר להניח שזו הסיבה.
ערכת האימון מכילה יותר מדי תכונות.
לא סביר להניח שזו הסיבה.