הוגנות: סוגי הטיה

מודלים של למידת מכונה (ML) לא אובייקטיביים מטבעם. מומחים בלמידת מכונה לאמן מודלים באמצעות הזנת מערך נתונים של דוגמאות אימון, מעורבות בהקצאה ובאיסוף של הנתונים האלה יכולה להפוך את המודל חיזויים שחשופים להטיה.

במהלך בניית מודלים, חשוב להיות מודעים להטיות נפוצות של בני אדם, כך שתוכלו לנקוט צעדים יזומים לצמצום באפקטים מיוחדים.

הטיה בדיווח

הטיה היסטורית

הטיית אוטומציה

הטיית בחירה

הטיית בחירה מתרחשת אם של מערך הנתונים נבחר בצורה שלא משקפת את ההפצה בעולם האמיתי. הטייה של בחירה עשויה לבוא בצורות רבות ושונות, כולל הטיית כיסוי, הטיה של אי-תגובה והטיית דגימה.

הטיית כיסוי

הטיה ללא תגובה

הטיית דגימה

הטיה בשיוך קבוצתי

הטיה בשיוך קבוצתי היא נטייה להכליל את מה שנכון לגבי אנשים פרטיים לכל הקבוצה, שאליהם הם שייכים. הטייה של שיוך קבוצתי באה לידי ביטוי לעיתים קרובות בשני מקרים הבאים הטפסים.

הטיה בתוך הקבוצה

הטיה הומוגנית כלפי קבוצה חוץ

הטיה מרומזת

הטיית אישור

הטיה של עורך הניסוי

תרגיל: בדקו את ההבנה שלכם

איזו מבין סוגי ההטיות הבאים הייתה יכולה לגרום לתחזיות המוטות במודל הקבלה למכללות שמתוארות אינץ' על המבוא?
הטיה היסטורית
מודל הקבלה אומן לפי רשומות של תלמידים מהעבר 20 שנה. אם תלמידים של מיעוט לא היו מיוצגים בנתונים האלה, שהמודל היה יכול לשחזר אותם אי-צדקים היסטוריים כשמבצעים תחזיות על נתונים חדשים של תלמידים.
הטיה בתוך הקבוצה
מודל הקבלה אומן על ידי סטודנטים נוכחיים באוניברסיטה, שיכול להיות שיש לו העדפה לא מודעת לקבל תלמידים שהגיעו מרקעים דומים להם, יכול להיות שהשפיעו על האופן שבו הם אסף או פיתחו נתונים שלפיה אומן המודל.
הטיית אישור
מודל הקבלה אומן על ידי סטודנטים נוכחיים באוניברסיטה, שסביר להניח שהיו להם אמונות קיימות לגבי סוגי ההסמכות. מצליחה בתוכנית במדעי המחשב. הם יכולים אספתם או פיתחו בטעות את הנתונים, המודל אישר את האמונות הקיימות האלה.
הטיית אוטומציה
הטיית אוטומציה עשויה להסביר למה ועדת הקבלה בחרה להשתמש במודל למידת מכונה כדי לקבל החלטות לגבי קבלה; יש להם האמינו שמערכת אוטומטית תניב תוצאות טובות יותר ההחלטות של בני אדם. עם זאת, ההטייה האוטומטית לא מספקת תובנות מסוימות לגבי ההטיה של החיזויים של המודל.