הוגנות: בחינת הידע שלך

  1. נכון או לא נכון: הטיה היסטורית מתרחשת כשמודל עובר אימון על נתונים ישנים.

  2. מהנדסים מאמנים מודל רגרסיה כדי לחזות את תכולת הקלוריות של ארוחות על סמך מגוון נתונים של תכונות שהם גיבשו מאתרי מתכונים ברחבי העולם, כולל גודל המנה, המרכיבים וטכניקות ההכנה. אילו מהבעיות הבאות בנתונים הן מקורות פוטנציאליים להטיה שצריך לחקור לעומק?

    אפשר לבחור כמה תשובות שרוצים.

  3. מודל לזיהוי סרקזם אומן על 80,000 הודעות טקסט: 40,000 הודעות שנשלחו על ידי מבוגרים (בני 18 ומעלה) ו-40,000 הודעות שנשלחו על ידי קטינים (מתחת לגיל 18). לאחר מכן, המודל נבדק במבחן של 20,000 מסרים: 10,000 ממבוגרים ו-10,000 מקטינים. מטריצות הבלבול הבאות מציגות את התוצאות עבור כל קבוצה (חיזוי חיובי פירושו סיווג של 'סרקסטית'; חיזוי שלילי מייצג סיווג של 'לא סרקסטית'):

    מבוגרים

    True Positives (TPs): 512 תוצאות חיוביות מוטעות (FP):
    שליליות שגויה (FN): 36 מילות מפתח שליליות אמיתיות (TN): 9401
    דיוק = TP/(TP + FP) = 0.909
    ריקול = TP/(TP + FN) = 0.934

    קטינים

    True Positives (TPs): 2147 חיוביות כוזבות: 96
    שליליות שגויות (FN): 2177 מילות מפתח שליליות אמיתיות (TN): 5580
    דיוק = TP/(TP + FP) = 0.957
    זיכרון = TP/(TP + FN) = 0.497

    אילו מההצהרות הבאות לגבי הביצועים של קבוצת הבדיקה של המודל הן נכונות?

    אפשר לבחור כמה תשובות שרוצים.

  4. איזו מההשערות הבאות יכולה להסביר את חוסר ההתאמה בביצועים של תת-קבוצות בקבוצת המבחן של המודל לזיהוי סרקזם שלמעלה?

    אפשר לבחור כמה תשובות שרוצים.

  5. מהנדסים עובדים על אימון מחדש של המודל הסרקזם שלמעלה כדי לטפל בחוסר עקביות בזיהוי סרקזם בקרב קבוצות דמוגרפיות שונות, אבל המודל כבר הופץ לייצור. איזו מהאסטרטגיות הבאות לפתרון הבעיה תעזור לצמצם שגיאות בחיזויים של המודל?