דף זה תורגם על ידי Cloud Translation API. מערכי נתונים, הכללה והתאמת יתר: בוחנים את הידע חזרה למסלול הלמידה איזו מהאפשרויות הבאות היא דוגמה למערך נתונים נייח? שיעורי הגשם בסיאטל, וושינגטון קטלוג של תווים מוזיקליים בסימפוניות של בטהובן המילים הנפוצות ביותר בהודעות ספאם מכירת כרטיסים יומיים בבית קולנוע אתם מתכוננים לאמן מודל לחיזוי מחיר המבצע של מכוניות משומשות באמצעות מערך נתונים שמכיל את התכונות הבאות: year, model ו-mileage. כשאתם בוחנים את מערך הנתונים, מגלים שחסרים ערכים של מרחק הנסיעה המצטבר ב-150 מתוך 2,500 דוגמאות. אילו מהאפשרויות הבאות הן פעולות הגיוניות? (יש לבחור את כל האפשרויות המתאימות) אפשר לבחור כמה תשובות שרוצים. הסרת 150 הדוגמאות ממערך הנתונים הסרת העמודה mileage ממערך הנתונים ואימון המודל לפי שנה ומודל בלבד הוספת ערך של 0 לכל שדות מרחק הנסיעה הריקים מסיקים את האומדן של mileage לכל שדה ריק על ידי הכפלת גיל הרכב בקילומטראז' השנתי הממוצע של כל המכוניות במערך הנתונים אתם מאמנים את מודל ההמלצות לסרטים של שירות סטרימינג כדי לחזות אם המשתמש ייהנה מסרט מסוים. אילו מהקטגוריות הבאות הן תוויות שרת proxy סבירות עבור 'המשתמש נהנה מהסרט'? (יש לבחור את כל האפשרויות המתאימות) אפשר לבחור כמה תשובות שרוצים. המשתמש שמר את הסרט ברשימה 'רוצה לצפות בו'. המשתמש לחץ על 'התחלת הצפייה בסרט'. המשתמש המליץ על הסרט למשתמש אחר. המשתמש העניק לסרט דירוג של 5 כוכבים. נכון או לא נכון: אחת הדרכים הטובות למנוע התאמה יתר היא אימון המודל עד שהוא ישיג ערך של אובדן נמוך בנתוני הבדיקה. נכון לא נכון עליך למלא את השדה הריק במשפט הבא: ההסתגלות משפרת את היכולת של המודל לכלול נתונים חדשים באופן כללי על ידי מתן עונש ___ במהלך האימון. חיזויים שגויים קצב למידה רמת המורכבות ירידה הדרגתית שליחת התשובות error_outline מתן הציונים בבוחן נכשל בגלל שגיאה. אפשר לנסות שוב.