מודלים של למידת מכונה (ML) הם לא אובייקטיביים מטבעם. מומחי למידת מכונה מארגנים מודלים על ידי הזנת מערך נתונים של דוגמאות לאימון, והמעורבות האנושית בהקצאה ובארגון של הנתונים האלה עלולה לגרום לכך שהתחזיות של המודל יהיו חשופות להטיה.
כשאתם בונים מודלים, חשוב להיות מודעים לנטיות אנושיות נפוצות שעשויות להתבטא בנתונים שלכם, כדי שתוכלו לנקוט פעולות יזום כדי לצמצם את ההשפעות שלהן.
הטיה בדיווח
-
הגדרה
הטיה בדיווח מתרחשת כאשר התדירות של האירועים, המאפיינים ו/או התוצאות שתועדו במערך נתונים לא משקפת במדויק את התדירות שלהם בעולם האמיתי. הטיה כזו יכולה להתרחש כי אנשים נוטים להתמקד בתיעוד נסיבות חריגות או מיוחדות במיוחד, מתוך הנחה שלא צריך לתעד אירועים רגילים.
-
דוגמה
מודל לניתוח סנטימנטים מיומן לחזות אם ביקורות על ספרים הן חיוביות או שליליות על סמך מאגר של תכנים שהמשתמשים שלחו לאתר פופולרי. רוב הביקורות במערך הנתונים של האימון משקפות דעות קיצוניות (מבקרי ספרים שאהבו או שנורא שנאו את הספר), כי הסיכוי של אנשים לשלוח ביקורת על ספר הוא נמוך יותר אם הם לא הגיבו אליו בצורה חזקה. כתוצאה מכך, המודל פחות מסוגל לחזות בצורה מדויקת את הסנטימנט של ביקורות שמשתמשות בשפה עדינה יותר כדי לתאר ספר.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה היסטורית
-
הגדרה
הטיה היסטורית מתרחשת כשנתונים היסטוריים משקפים אי-שוויון שהיה קיים בעולם באותה תקופה.
-
דוגמה
מערך נתונים של דיור בעיר משנות ה-60 מכיל נתוני מחירי בתים שמשקפים את שיטות ההלוואות המפלות שחלה במהלך העשור הזה.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיית אוטומציה
-
הגדרה
הטיה של אוטומציה היא נטייה להעדיף תוצאות שנוצרו על ידי מערכות אוטומטיות על פני תוצאות שנוצרו על ידי מערכות לא אוטומטיות, ללא קשר לשיעורי השגיאה של כל אחת מהן.
-
דוגמה
מומחי למידת מכונה שעובדים עבור יצרן של גלגלי שיניים היו להוטים לפרוס את המודל החדש "המהפכני" שהם אימנו לזיהוי פגמים בשיניים, עד שמנהל המפעל ציין ששיעורי הדיוק וההחזקה של המודל נמוכים ב-15% מאלה של המפקחים האנושיים.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה בבחירה
הטיה בבחירת דוגמאות מתרחשת אם הדוגמאות של מערך הנתונים נבחרות באופן שלא משקף את ההפצה שלהן בעולם האמיתי. להטיית בחירה יכולות להיות צורות רבות, כולל הטיית כיסוי, הטיה של אי-תגובה והטיית דגימה.
הטיית כיסוי
-
הגדרה
ההטיה של הכיסוי מתרחשת אם הנתונים לא נבחרים בצורה מייצגת.
-
דוגמה
מודל מאומן לחזות מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו בקרב מדגם של צרכנים שקנו את המוצר. לא בוצע סקר בקרב צרכנים שבמקום זאת בחרו לקנות מוצר מתחרה, וכתוצאה מכך קבוצת האנשים הזו לא הייתה מיוצגת בנתוני האימון.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה של אי-תגובה
-
הגדרה
הטיה של אי-תגובה (שנקראת גם הטיה של השתתפות) מתרחשת אם הנתונים לא מייצגים את האוכלוסייה בגלל פערים בהשתתפות בתהליך איסוף הנתונים.
-
דוגמה
מודל מאומן לחיזוי מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו עם דגימה של צרכנים שקנו את המוצר ועם מדגם של צרכנים שקנו מוצר מתחרה. הסיכוי של צרכנים שקנו את המוצר המתחרה לסרב למלא את הסקר היה גבוה ב-80%, והנתונים שלהם היו מיוצגים באופן לא פרופורציונלי במדגם.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה בדגימה
-
הגדרה
הטיה בדגימה מתרחשת אם לא נעשה שימוש ברנדומיזציה מתאימה במהלך איסוף הנתונים.
-
דוגמה
מודל מאומן לחזות מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו בקרב מדגם של צרכנים שקנו את המוצר, ובקרב מדגם של צרכנים שקנו מוצר מתחרה. במקום לטרגט צרכנים באופן אקראי, הסקרים בחרו את 200 הצרכנים הראשונים שהשיבו לאימייל, שיכול להיות שהיו נלהבים יותר מהמוצר מאשר רוכשים ממוצעים.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה בייחוס לקבוצה
הטיית שיוך (Attribution) קבוצתי היא נטייה ליצור כללי של ההתייחסות לאנשים ספציפיים לכל הקבוצה שאליה הם שייכים. הטיה של שיוך קבוצתי מתבטאת לעיתים קרובות בשתי הצורות הבאות:
הטיה בתוך הקבוצה
-
הגדרה
הטיה לטובת הקבוצה היא העדפה של חברים בקבוצה שלכם שאתם גם שייכים אליה, או של מאפיינים שאתם גם חולקים.
-
דוגמה
שני מומחי למידת מכונה שמאמנים מודל לסינון קורות חיים של מפתחי תוכנה נוטים להאמין שהמועמדים שלמדו באותה האקדמיה למדעי המחשב כמוהם מתאימים יותר לתפקיד.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה הומוגנית כלפי קבוצה חוץ
-
הגדרה
הטיה של הומוגניות בקבוצה חיצונית היא נטייה להתייחס באופן סטריאוטיפי לחברים ספציפיים בקבוצה שאליה אתם לא שייכים, או לראות את המאפיינים שלהם כמאוחדים יותר.
-
דוגמה
שני מומחי למידת מכונה שמאמנים מודל לסינון קורות חיים של מפתחי תוכנה נוטים להאמין שכל המועמדים שלא למדו באקדמיה למדעי המחשב לא מספיק מומחים לתפקיד.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה מרומזת
-
הגדרה
הטיה משתמעת מתרחשת כשאנשים מקבלים הנחות על סמך מודל החשיבה והחוויות האישיות שלהם, שלא בהכרח רלוונטיות באופן כללי.
-
דוגמה
אנשי מקצוע בתחום למידת מכונה שמאמנים מודל של זיהוי תנועה משתמשים בנדנוד בתור תכונה כדי לציין שאדם אומר את המילה 'לא'. עם זאת, באזורים מסוימים בעולם, תנועת ראש בתנועה של 'לא' היא למעשה סימן ל'כן'.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיית אישור
-
הגדרה
הטיה של אישור מתרחשת כשמפתחי מודלים מעבדים נתונים באופן לא מודע באופן שמאשר אמונות והשערות קיימות.
-
דוגמה
אנשי מקצוע בתחום למידת מכונה בונים מודל לחיזוי אגרסיביות בכלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, סביבה). למטפל הייתה חוויה לא נעימה עם פודל צעצוע היפראקטיבי כילד, ומאז הוא משייך את הגזע לאגרסיביות. כשהחוקר בחר את נתוני האימון של המודל, הוא זרק באופן לא מודע מאפיינים שסיפקו ראיות לכך שכלבים קטנים יותר צייתנים.
לוחצים על chevron_left כדי להציג את ההגדרה.
הטיה של מבצע הניסוי
-
הגדרה
הטיה של מבצע הניסוי מתרחשת כשמפתח המודל ממשיך לאמן מודל עד שהוא מניב תוצאה שתואמת להיפותזה המקורית שלו.
-
דוגמה
מומחה ל-ML מפתח מודל לחיזוי תוקפנות אצל כלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, סביבה). למטפל הייתה חוויה לא נעימה עם פודל צעצוע היפראקטיבי כילד, ומאז הוא משייך את הגזע לאגרסיביות. כשהמודל המאומן חזה שרוב הפודלס הזעירים הם יחסית צייתנים, המשתמש מאמן מחדש את המודל כמה פעמים נוספות עד שהתקבלה תוצאה שמראה שפודלס קטנים יותר הם אלימים יותר.
להגדרה, לוחצים על chevron_left.