דף זה תורגם על ידי Cloud Translation API. הוגנות: בחינת הידע שלך חזרה למסלול הלמידה נכון או לא נכון: הטיה היסטורית מתרחשת כשמודל עובר אימון על נתונים ישנים. נכון לא נכון מהנדסים מאמנים מודל רגרסיה כדי לחזות את תכולת הקלוריות של ארוחות על סמך מגוון נתונים של תכונות שהם גיבשו מאתרי מתכונים ברחבי העולם, כולל גודל המנה, המרכיבים וטכניקות ההכנה. אילו מהבעיות הבאות בנתונים הן מקורות פוטנציאליים להטיה שצריך לחקור לעומק? אפשר לבחור כמה תשובות שרוצים. בכ-4,000 מתוך 40,000 דוגמאות האימון חסר ערך של התכונה 'גודל מנה'. בכ-5,000 מדוגמאות האימון היו מדידות ביחידות אימפריאליות (אונקיות, פאונד וכו'), בעוד שב-35,000 הדוגמאות האחרות היו מדידות ביחידות מידה מטריות (גרם, ליטרים וכן הלאה). כ-100 מתוך 40,000 דוגמאות האימון כללו ערכי רכיבים שסביר מאוד שהם יהיו שגויים (למשל, 100 מקלות חמאה). חלק מהארוחות הפופולריות קיבלו ייצוג נמוך מדי בנתוני האימון ביחס לארוחות פופולריות אחרות (למשל, היו 200 דוגמאות אימון לדוסה, אבל רק 10 לפיצה). מודל לזיהוי סרקזם אומן על 80,000 הודעות טקסט: 40,000 הודעות שנשלחו על ידי מבוגרים (בני 18 ומעלה) ו-40,000 הודעות שנשלחו על ידי קטינים (מתחת לגיל 18). לאחר מכן, המודל נבדק במבחן של 20,000 מסרים: 10,000 ממבוגרים ו-10,000 מקטינים. מטריצות הבלבול הבאות מציגות את התוצאות עבור כל קבוצה (חיזוי חיובי פירושו סיווג של 'סרקסטית'; חיזוי שלילי מייצג סיווג של 'לא סרקסטית'): מבוגרים True Positives (TPs): 512 תוצאות חיוביות מוטעות (FP): שליליות שגויה (FN): 36 מילות מפתח שליליות אמיתיות (TN): 9401 דיוק = TP/(TP + FP) = 0.909 ריקול = TP/(TP + FN) = 0.934 קטינים True Positives (TPs): 2147 חיוביות כוזבות: 96 שליליות שגויות (FN): 2177 מילות מפתח שליליות אמיתיות (TN): 5580 דיוק = TP/(TP + FP) = 0.957 זיכרון = TP/(TP + FN) = 0.497 אילו מההצהרות הבאות לגבי הביצועים של קבוצת הבדיקה של המודל הן נכונות? אפשר לבחור כמה תשובות שרוצים. הביצועים של המודל משתפרים על דוגמאות של מבוגרים מאשר על דוגמאות מקטינים. 10,000 ההודעות שנשלחות על ידי מבוגרים הן מערך נתונים לא מאוזן לכיתה. 10,000 ההודעות שנשלחות על ידי קטינים הן מערך נתונים שאינו מאוזן לשימוש בכיתה. כ-50% מההודעות שנשלחות על ידי קטינים מסווגות כ'סרקסטיות' באופן שגוי. המודל לא מסווג כ-50% מהמסרים הסרקסטיים של קטינים כ"סרקסטיים". איזו מההשערות הבאות יכולה להסביר את חוסר ההתאמה בביצועים של תת-קבוצות בקבוצת המבחן של המודל לזיהוי סרקזם שלמעלה? אפשר לבחור כמה תשובות שרוצים. המודל טועה יותר מדי מבחינת החיזוי 'סרקטי'. כתוצאה מכך, יש שגיאות רבות יותר בסיווג של קטינים הודעות טקסט, כי בערכת הבדיקה יש הודעות סרקסטיות יותר מקטינים. המודל נבדק על סמך יותר דוגמאות שליליות (לא סרקסטיות) שנשלחו מקטינים בהשוואה למבוגרים, וכתוצאה מכך התקבלו יותר שגיאות בנוגע לקטינים. סרקזם בהודעות טקסט של קטינים היה מעודן יותר, ולכן סביר פחות שהמודל יסמן אותו. יש הרבה פחות הודעות סרקסטיות ממבוגרים מאשר מקטינים. אם המודל נבדק לפי קבוצה מאוזנת יותר של הודעות למבוגרים בלבד, שיעור הזכירה שלו עשוי לרדת עבור אותה תת-קבוצה. מהנדסים עובדים על אימון מחדש של המודל הסרקזם שלמעלה כדי לטפל בחוסר עקביות בזיהוי סרקזם בקרב קבוצות דמוגרפיות שונות, אבל המודל כבר הופץ לייצור. איזו מהאסטרטגיות הבאות לפתרון הבעיה תעזור לצמצם שגיאות בחיזויים של המודל? להגביל את השימוש של המודל להודעות טקסט שנשלחות על ידי קטינים. משנים את הפלט של המודל כך שיחזיר 'סרקסטיות' לכל הודעות הטקסט שנשלחו על ידי קטינים, בלי קשר למה שהמודל חזה במקור. אם לפי החיזוי של המודל מוגדר 'לא סרקסטי' להודעות טקסט שנשלחו על ידי קטינים, צריך לשנות את הפלט כך שהמודל יחזיר במקום זאת את הערך 'לא בטוח'. שליחת התשובות error_outline מתן הציונים בבוחן נכשל בגלל שגיאה. אפשר לנסות שוב.