מערכי נתונים, הכללה והתאמת יתר: בוחנים את הידע

  1. איזו מהאפשרויות הבאות היא דוגמה למערך נתונים נייח?

  2. אתם מתכוננים לאמן מודל לחיזוי מחיר המבצע של מכוניות משומשות באמצעות מערך נתונים שמכיל את התכונות הבאות: year, model ו-mileage. כשאתם בוחנים את מערך הנתונים, מגלים שחסרים ערכים של מרחק הנסיעה המצטבר ב-150 מתוך 2,500 דוגמאות. אילו מהאפשרויות הבאות הן פעולות הגיוניות? (יש לבחור את כל האפשרויות המתאימות)

    אפשר לבחור כמה תשובות שרוצים.

  3. אתם מאמנים את מודל ההמלצות לסרטים של שירות סטרימינג כדי לחזות אם המשתמש ייהנה מסרט מסוים. אילו מהקטגוריות הבאות הן תוויות שרת proxy סבירות עבור 'המשתמש נהנה מהסרט'? (יש לבחור את כל האפשרויות המתאימות)

    אפשר לבחור כמה תשובות שרוצים.

  4. נכון או לא נכון: אחת הדרכים הטובות למנוע התאמה יתר היא אימון המודל עד שהוא ישיג ערך של אובדן נמוך בנתוני הבדיקה.

  5. עליך למלא את השדה הריק במשפט הבא:
    ההסתגלות משפרת את היכולת של המודל לכלול נתונים חדשים באופן כללי על ידי מתן עונש ___ במהלך האימון.