מודלים של למידת מכונה (ML) לא אובייקטיביים מטבעם. מומחים בלמידת מכונה לאמן מודלים באמצעות הזנת מערך נתונים של דוגמאות אימון, מעורבות בהקצאה ובאיסוף של הנתונים האלה יכולה להפוך את המודל חיזויים שחשופים להטיה.
במהלך בניית מודלים, חשוב להיות מודעים להטיות נפוצות של בני אדם, כך שתוכלו לנקוט צעדים יזומים לצמצום באפקטים מיוחדים.
הטיה בדיווח
-
הגדרה
הטיות בדיווח מתרחשת כשהתדירות של אירועים, נכסים ו/או תוצאות שתועדו במערך הנתונים לשקף במדויק את התדירות שלהם בעולם האמיתי. ההטיה הזו עלולה לקרות כי אנשים נוטים להתמקד בתיעוד נסיבות יוצא דופן או בלתי נשכח במיוחד, בהנחה צריך לתעד אותן.
-
דוגמה
מודל ניתוח סנטימנטים מאומן לחזות אם ספר הביקורות הן חיוביות או שליליות על סמך אוסף המשתמשים שליחה של תכנים לאתר פופולרי. רוב הביקורות מערך הנתונים של האימון משקף דעות קיצוניות (בודקים ספר שהם אהבו או שננאו), כי היה פחות סיכוי שאנשים ישלחו אותו ביקורת על ספר אם הם לא מגיבים אליה בצורה חמורה. בתור כתוצאה מכך, המודל לא יכול לחזות בצורה נכונה את הסנטימנטים ביקורות שמשתמשות בשפה עדינה יותר כדי לתאר ספר.
לוחצים על chevron_left להגדרה.
הטיה היסטורית
-
הגדרה
הטיה היסטורית מתרחשת כאשר נתונים היסטוריים משקף אי שוויונים שהיו קיימים בעולם באותו זמן.
-
דוגמה
מערך נתונים על דיור משנות ה-60 של המאה ה-20, מכיל נתוני מחיר בית שמשקפת שיטות הלוואות מפלות שהיו בתוקף במהלך התקופה הזו בעשור הזה.
לוחצים על chevron_left להגדרה.
הטיית אוטומציה
-
הגדרה
הטיית אוטומציה היא נטייה להעדיף תוצאות שנוצרו על ידי מערכות אוטומטיות, ולא על ידי מערכות שנוצרות על ידי מערכות לא אוטומטיות בלי קשר לשיעורי השגיאות של כל אחת מהן.
-
דוגמה
בעלי מקצוע בלמידת מכונה שעבדו עבור יצרנית תמיכה היו שמחים מאוד לפרוס את המודל החדש מודל שהם אימנו לזהות לפגמים בשיניים עד שמפקח המפעל ציין הדיוק ושיעורי הריקול של המודל היו נמוכים ב-15% של חוקרים אנושיים.
לוחצים על chevron_left להגדרה.
הטיית בחירה
הטיית בחירה מתרחשת אם של מערך הנתונים נבחר בצורה שלא משקפת את ההפצה בעולם האמיתי. הטייה של בחירה עשויה לבוא בצורות רבות ושונות, כולל הטיית כיסוי, הטיה של אי-תגובה והטיית דגימה.
הטיית כיסוי
-
הגדרה
הטיה בכיסוי מתרחשת אם לא בוחרים נתונים בצורה מייצגת.
-
דוגמה
מודל מאומן לחזות מכירות עתידיות של מוצר חדש סקרים בטלפון שנערכו עם מדגם של צרכנים את המוצר. צרכנים שבחרו במקום זאת לקנות מוצר מתחרה לא השתתפו בסקר, ולכן קבוצת האנשים הזו שמיוצגים בנתוני האימון.
לוחצים על chevron_left להגדרה.
הטיה ללא תגובה
-
הגדרה
הטיות ללא תגובה (נקראות גם הטיה בהשתתפות) אם הנתונים מסתיימים לא מייצגים בגלל פערים באיסוף הנתונים תהליך האימות.
-
דוגמה
מודל מאומן לחזות מכירות עתידיות של מוצר חדש סקרים בטלפון שנערכו עם מדגם של צרכנים את המוצר ועם מדגם של צרכנים שקנו מוצר מתחרה המוצר. מספר הצרכנים שקנו את המוצר המתחרה גדל ב-80% סביר להניח שהם יסרבו למלא את הסקר, והנתונים שלהם שסובלים מחוסר ייצוג במדגם.
לוחצים על chevron_left להגדרה.
הטיית דגימה
-
הגדרה
הטיית דגימה מתרחשת אם מתבצעת רנדומיזציה נכונה לא בשימוש במהלך איסוף הנתונים.
-
דוגמה
מודל מאומן לחזות מכירות עתידיות של מוצר חדש סקרים בטלפון שנערכו עם מדגם של צרכנים את המוצר ועם מדגם של צרכנים שקנו מוצר מתחרה המוצר. במקום לטרגט צרכנים בצורה אקראית, בחרו את 200 הצרכנים הראשונים שהשיבו לאימייל, היו נלהבים יותר מהמוצר חדשים.
לוחצים על chevron_left להגדרה.
הטיה בשיוך קבוצתי
הטיה בשיוך קבוצתי היא נטייה להכליל את מה שנכון לגבי אנשים פרטיים לכל הקבוצה, שאליהם הם שייכים. הטייה של שיוך קבוצתי באה לידי ביטוי לעיתים קרובות בשני מקרים הבאים הטפסים.
הטיה בתוך הקבוצה
-
הגדרה
הטיה בתוך הקבוצה היא העדפה לחברים ביעד לקבוצה שלכם אתם גם שייכים, או למאפיינים שגם אתם משתפים.
-
דוגמה
שני בעלי מקצוע בתחום למידת מכונה שמאמנים מודל סינון קורות חיים מפתחי תוכנות עלולים להאמין שהמועמדים שלמדו אותה אקדמיה למדעי המחשב כמו ששניהם למדו מתאימים יותר לתפקיד.
לוחצים על chevron_left להגדרה.
הטיה הומוגנית כלפי קבוצה חוץ
-
הגדרה
הטיה והומוגניות מחוץ לקבוצה היא נטייה סטריאוטיפי לגבי חברים בקבוצה שאתם לא שייכים אליה, שייכים, או שהמאפיינים שלהם אחידים יותר.
-
דוגמה
שני בעלי מקצוע בתחום למידת מכונה שמאמנים מודל סינון קורות חיים מפתחי תוכנות עלולים להאמין שכל המועמדים שלא למדו באקדמיה למדעי המחשב, מספיק במומחיות לתפקיד.
לוחצים על chevron_left להגדרה.
הטיה מרומזת
-
הגדרה
הטיה מרומזת מתרחשת כשהמערכת מניחה הנחות שמבוסס על מודל החשיבה והחוויות האישיות שלו, לא חלות בהכרח באופן כללי יותר.
-
דוגמה
מתאמנים בלמידת מכונה שמאמנים מודל זיהוי תנועה משתמש לנעור ראש בתור תכונה שמציינת שאדם אומר את המילה 'לא'. עם זאת, באזורים מסוימים בעולם, אכן, פירושו 'כן'.
לוחצים על chevron_left להגדרה.
הטיית אישור
-
הגדרה
הטיית אישור מתרחשת כשבוני מודלים לעבד נתונים באופן לא מודע בדרכים שמאשרות את קיומם של האמונות הקיימות והשערות.
-
דוגמה
בעלי מקצוע בתחום למידת מכונה מפתח מודל חיזוי אגרסיבי לכלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, הסביבה). למתרגל הייתה מפגש לא נעים עם פודל צעצוע היפר-אקטיבי כילד, ומאז אי פעם קישר הגזע של תוקפנות. כשיוצרים את נתוני האימון של המודל, בעלי המקצוע ביטלו באופן לא מודע תכונות שסיפקו עדויות לציות בכלבים קטנים.
לוחצים על chevron_left להגדרה.
הטיה של עורך הניסוי
-
הגדרה
ההטיה של עורך הניסוי מתרחשת כאשר יוצר המודלים ממשיך לאמן את המודל עד שהוא מניב תוצאה שתואמת הנחת השער המקורית שלהם.
-
דוגמה
בעלי מקצוע בתחום למידת מכונה מפתח מודל חיזוי אגרסיבי לכלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, הסביבה). למתרגל הייתה מפגש לא נעים עם פודל צעצוע היפר-אקטיבי כילד, ומאז אי פעם קישר הגזע של תוקפנות. מתי המודל המאומן חזה את רוב פודלים של צעצוע כך שיהיו מנומסים יחסית, המתרגל גדיר את הפודל מחדש. את המודל עוד כמה פעמים, עד שהוא הפיק תוצאה פודלים קטנים יותר להיות אלימים יותר.
לוחצים על chevron_left להגדרה.