מערכי נתונים, הכללה והתאמת יתר

מבוא

יחידת הלימוד הזו מתחילה בשאלה מובילה. יש לבחור אחת מהתשובות הבאות:

אם הייתם צריכים לשפר אחד מהתחומים הבאים כרגע בפרויקט למידת מכונה, בצורה יעילה?
שימוש בפונקציית הפסד חכמה יותר כדי לאמן את המודל
שיפור האיכות של מערך הנתונים

והנה שאלה מובילה עוד יותר:

נחשו: בפרויקט למידת המכונה שלכם, כמה זמן אתם בדרך כלל משקיעים בהכנה ובטרנספורמציה של נתונים?
פחות ממחצית מזמן הפרויקט
יותר ממחצית מזמן הפרויקט

ביחידה הזאת נלמד על המאפיינים של למידת מכונה ואיך להכין את הנתונים שלכם כדי להבטיח תוצאות באיכות גבוהה, אימון והערכה של המודל.