הוגנות: סוגי הטיה

מודלים של למידת מכונה (ML) הם לא אובייקטיביים מטבעם. מומחי למידת מכונה מארגנים מודלים על ידי הזנת מערך נתונים של דוגמאות לאימון, והמעורבות האנושית בהקצאה ובארגון של הנתונים האלה עלולה לגרום לכך שהתחזיות של המודל יהיו חשופות להטיה.

כשאתם בונים מודלים, חשוב להיות מודעים לנטיות אנושיות נפוצות שעשויות להתבטא בנתונים שלכם, כדי שתוכלו לנקוט פעולות יזום כדי לצמצם את ההשפעות שלהן.

הטיה בדיווח

הטיה היסטורית

הטיית אוטומציה

הטיה בבחירה

הטיה בבחירת דוגמאות מתרחשת אם הדוגמאות של מערך הנתונים נבחרות באופן שלא משקף את ההפצה שלהן בעולם האמיתי. להטיית בחירה יכולות להיות צורות רבות, כולל הטיית כיסוי, הטיה של אי-תגובה והטיית דגימה.

הטיית כיסוי

הטיה של אי-תגובה

הטיה בדגימה

הטיה בייחוס לקבוצה

הטיית שיוך (Attribution) קבוצתי היא נטייה ליצור כללי של ההתייחסות לאנשים ספציפיים לכל הקבוצה שאליה הם שייכים. הטיה של שיוך קבוצתי מתבטאת לעיתים קרובות בשתי הצורות הבאות:

הטיה בתוך הקבוצה

הטיה הומוגנית כלפי קבוצה חוץ

הטיה מרומזת

הטיית אישור

הטיה של מבצע הניסוי

תרגול: בדיקת ההבנה

איזה מהסוגים הבאים של הטיה יכול היה לתרום לחזויות המוטה במודל הקבלה לקולג' שמתואר במבוא?
הטיית אישור
הטיה לטובת הקבוצה
הטיית אוטומציה
הטיה היסטורית