עבודה עם נתונים מספריים: בחינת הידע שלכם

  1. איזו מהטכניקות הבאות לא סוג של הנדסת פיצ'רים (feature engineering)?

  2. אתם מאמנים מודל על נתונים לגבי בריאות של תינוקות. אחת התכונות היא birth_weight. ברצונך לנרמל את ערכי ה-birth_weight האלה כדי לאמן את המודל בצורה יעילה יותר. אילו מטכניקות הנירמול הבאות הכי מתאימות?

  3. נכון או לא נכון: Binning היא שיטה להמרת נתונים קטגוריים לנתונים מספריים.

  4. נתוני האימון של מודל המלצה לנעליים מכילים את התכונה shoe_size, שאמורה להכיל ערכים בין 6 ל-16. בטבלה הבאה מוצגים ערכי shoe_size לשש דוגמאות במערך הנתונים:

    דוגמה shoe_size
    1 8.5
    2 9
    3 לא רלוונטי
    4 105
    5 11
    6 9

    אילו דוגמאות כדאי לקרצף ממערך הנתונים לפני האימון? (יש לבחור את כל האפשרויות המתאימות)

    אפשר לבחור כמה תשובות שרוצים.

  5. צריך למלא את השדה הבא במשפט הבא:
    במהלך הנדסת פיצ'רים, ניתן ליצור תכונות סינתטיות ל___.