סיווג: בחינת הידע

  1. איזו מההשפעות הבאות צפויה להגדיל את ערך הסף של מסווג בינארי?

  2. במערך הנתונים שמפצלים לשניים לאמן, בודקים ומעריכים קבוצות יש 9,998 דוגמאות שליליות ו-2 דוגמאות חיוביות. שיעור הדיוק של המודל שמתקבל הוא 99.9%. אפשר לתת אמון במודל הזה לפי מדד הדיוק הזה?

  3. באופן כללי, כשהדיוק עולה, מה קורה לזכור?

  4. True או False: הנקודות על עקומת ה-ROC (מאפייני הפעלה של מקלט) של מודל סיווג בינארי הקרוב ביותר אל (1,1) (בפינה הימנית העליונה) מייצגות בדרך כלל את ערכי הסף עם הביצועים הטובים ביותר למודל

  5. אתם מעריכים את הביצועים של שני מודלים בינאריים לסיווג: מודל א' ומודל ב'. מספר AUC של מודל א' הוא 0.5. החיזויים של מודל ב' מתבצעים באופן אקראי לחלוטין. איזה מההצהרות הבאות נכון?