דף זה תורגם על ידי Cloud Translation API.

הוגנות: סוגי הטיה

מודלים של למידת מכונה (ML) הם לא אובייקטיביים מטבעם. מומחי למידת מכונה מארגנים מודלים על ידי הזנת מערך נתונים של דוגמאות לאימון, והמעורבות האנושית בהקצאה ובארגון של הנתונים האלה עלולה לגרום לכך שהתחזיות של המודל יהיו חשופות להטיה.

כשאתם בונים מודלים, חשוב להיות מודעים לנטיות אנושיות נפוצות שעשויות להתבטא בנתונים שלכם, כדי שתוכלו לנקוט פעולות יזום כדי לצמצם את ההשפעות שלהן.

הטיה בדיווח

הגדרה

הטיה בדיווח מתרחשת כאשר התדירות של האירועים, המאפיינים ו/או התוצאות שתועדו במערך נתונים לא משקפת במדויק את התדירות שלהם בעולם האמיתי. הטיה כזו יכולה להתרחש כי אנשים נוטים להתמקד בתיעוד נסיבות חריגות או מיוחדות במיוחד, מתוך הנחה שלא צריך לתעד אירועים רגילים.

לוחצים על chevron_right כדי לראות דוגמה.
דוגמה

מודל לניתוח סנטימנטים מיומן לחזות אם ביקורות על ספרים הן חיוביות או שליליות על סמך מאגר של תכנים שהמשתמשים שלחו לאתר פופולרי. רוב הביקורות במערך הנתונים של האימון משקפות דעות קיצוניות (מבקרי ספרים שאהבו או שנורא שנאו את הספר), כי הסיכוי של אנשים לשלוח ביקורת על ספר הוא נמוך יותר אם הם לא הגיבו אליו בצורה חזקה. כתוצאה מכך, המודל פחות מסוגל לחזות בצורה מדויקת את הסנטימנט של ביקורות שמשתמשות בשפה עדינה יותר כדי לתאר ספר.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה היסטורית

הגדרה

הטיה היסטורית מתרחשת כשנתונים היסטוריים משקפים אי-שוויון שהיה קיים בעולם באותה תקופה.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מערך נתונים של דיור בעיר משנות ה-60 מכיל נתוני מחירי בתים שמשקפים את שיטות ההלוואות המפלות שחלה במהלך העשור הזה.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיית אוטומציה

הגדרה

הטיה של אוטומציה היא נטייה להעדיף תוצאות שנוצרו על ידי מערכות אוטומטיות על פני תוצאות שנוצרו על ידי מערכות לא אוטומטיות, ללא קשר לשיעורי השגיאה של כל אחת מהן.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מומחי למידת מכונה שעובדים עבור יצרן של גלגלי שיניים היו להוטים לפרוס את המודל החדש "המהפכני" שהם אימנו לזיהוי פגמים בשיניים, עד שמנהל המפעל ציין ששיעורי הדיוק וההחזקה של המודל נמוכים ב-15% מאלה של המפקחים האנושיים.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה בבחירה

הטיה בבחירת דוגמאות מתרחשת אם הדוגמאות של מערך הנתונים נבחרות באופן שלא משקף את ההפצה שלהן בעולם האמיתי. להטיית בחירה יכולות להיות צורות רבות, כולל הטיית כיסוי, הטיה של אי-תגובה והטיית דגימה.

הטיית כיסוי

הגדרה

ההטיה של הכיסוי מתרחשת אם הנתונים לא נבחרים בצורה מייצגת.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מודל מאומן לחזות מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו בקרב מדגם של צרכנים שקנו את המוצר. לא בוצע סקר בקרב צרכנים שבמקום זאת בחרו לקנות מוצר מתחרה, וכתוצאה מכך קבוצת האנשים הזו לא הייתה מיוצגת בנתוני האימון.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה של אי-תגובה

הגדרה

הטיה של אי-תגובה (שנקראת גם הטיה של השתתפות) מתרחשת אם הנתונים לא מייצגים את האוכלוסייה בגלל פערים בהשתתפות בתהליך איסוף הנתונים.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מודל מאומן לחיזוי מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו עם דגימה של צרכנים שקנו את המוצר ועם מדגם של צרכנים שקנו מוצר מתחרה. הסיכוי של צרכנים שקנו את המוצר המתחרה לסרב למלא את הסקר היה גבוה ב-80%, והנתונים שלהם היו מיוצגים באופן לא פרופורציונלי במדגם.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה בדגימה

הגדרה

הטיה בדגימה מתרחשת אם לא נעשה שימוש ברנדומיזציה מתאימה במהלך איסוף הנתונים.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מודל מאומן לחזות מכירות עתידיות של מוצר חדש על סמך סקרים טלפוניים שנערכו בקרב מדגם של צרכנים שקנו את המוצר, ובקרב מדגם של צרכנים שקנו מוצר מתחרה. במקום לטרגט צרכנים באופן אקראי, הסקרים בחרו את 200 הצרכנים הראשונים שהשיבו לאימייל, שיכול להיות שהיו נלהבים יותר מהמוצר מאשר רוכשים ממוצעים.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה בייחוס לקבוצה

הטיית שיוך (Attribution) קבוצתי היא נטייה ליצור כללי של ההתייחסות לאנשים ספציפיים לכל הקבוצה שאליה הם שייכים. הטיה של שיוך קבוצתי מתבטאת לעיתים קרובות בשתי הצורות הבאות:

הטיה בתוך הקבוצה

הגדרה

הטיה לטובת הקבוצה היא העדפה של חברים בקבוצה שלכם שאתם גם שייכים אליה, או של מאפיינים שאתם גם חולקים.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

שני מומחי למידת מכונה שמאמנים מודל לסינון קורות חיים של מפתחי תוכנה נוטים להאמין שהמועמדים שלמדו באותה האקדמיה למדעי המחשב כמוהם מתאימים יותר לתפקיד.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה הומוגנית כלפי קבוצה חוץ

הגדרה

הטיה של הומוגניות בקבוצה חיצונית היא נטייה להתייחס באופן סטריאוטיפי לחברים ספציפיים בקבוצה שאליה אתם לא שייכים, או לראות את המאפיינים שלהם כמאוחדים יותר.

כדי לראות דוגמה, לוחצים על chevron_right
דוגמה

שני מומחי למידת מכונה שמאמנים מודל לסינון קורות חיים של מפתחי תוכנה נוטים להאמין שכל המועמדים שלא למדו באקדמיה למדעי המחשב לא מספיק מומחים לתפקיד.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה מרומזת

הגדרה

הטיה משתמעת מתרחשת כשאנשים מקבלים הנחות על סמך מודל החשיבה והחוויות האישיות שלהם, שלא בהכרח רלוונטיות באופן כללי.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

אנשי מקצוע בתחום למידת מכונה שמאמנים מודל של זיהוי תנועה משתמשים בנדנוד בתור תכונה כדי לציין שאדם אומר את המילה 'לא'. עם זאת, באזורים מסוימים בעולם, תנועת ראש בתנועה של 'לא' היא למעשה סימן ל'כן'.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיית אישור

הגדרה

הטיה של אישור מתרחשת כשמפתחי מודלים מעבדים נתונים באופן לא מודע באופן שמאשר אמונות והשערות קיימות.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

אנשי מקצוע בתחום למידת מכונה בונים מודל לחיזוי אגרסיביות בכלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, סביבה). למטפל הייתה חוויה לא נעימה עם פודל צעצוע היפראקטיבי כילד, ומאז הוא משייך את הגזע לאגרסיביות. כשהחוקר בחר את נתוני האימון של המודל, הוא זרק באופן לא מודע מאפיינים שסיפקו ראיות לכך שכלבים קטנים יותר צייתנים.

לוחצים על chevron_left כדי להציג את ההגדרה.

הטיה של מבצע הניסוי

הגדרה

הטיה של מבצע הניסוי מתרחשת כשמפתח המודל ממשיך לאמן מודל עד שהוא מניב תוצאה שתואמת להיפותזה המקורית שלו.

לוחצים על chevron_right כדי להציג דוגמה
דוגמה

מומחה ל-ML מפתח מודל לחיזוי תוקפנות אצל כלבים על סמך מגוון מאפיינים (גובה, משקל, גזע, סביבה). למטפל הייתה חוויה לא נעימה עם פודל צעצוע היפראקטיבי כילד, ומאז הוא משייך את הגזע לאגרסיביות. כשהמודל המאומן חזה שרוב הפודלס הזעירים הם יחסית צייתנים, המשתמש מאמן מחדש את המודל כמה פעמים נוספות עד שהתקבלה תוצאה שמראה שפודלס קטנים יותר הם אלימים יותר.

להגדרה, לוחצים על chevron_left.

תרגול: בדיקת ההבנה

איזה מהסוגים הבאים של הטיה יכול היה לתרום לחזויות המוטה במודל הקבלה לקולג' שמתואר במבוא?

הטיה היסטורית

מודל הקבלה הוכשר על סמך רשומות של תלמידים מ-20 השנים האחרונות. אם תלמידים מקבוצות מיעוט לא היו מיוצגים באופן הולם בנתונים האלה, המודל היה עלול לשחזר את אותן אי-השוויות היסטוריות כשיבצע חיזויים על נתוני תלמידים חדשים.

הטיה לטובת הקבוצה

מודל הקבלה אומן על ידי סטודנטים פעילים באוניברסיטה, שיכול להיות שהיו להם העדפות לא מודעות לקבלת סטודנטים שמגיעים מרקעים דומים לשלהם, ויכול להיות שההעדפות האלה השפיעו על האופן שבו הם אספו או עיצבו את המאפיינים של הנתונים שעליהם התבסס המודל.

הטיית אישור

מודל הקבלה הוכשר על ידי סטודנטים פעילים באוניברסיטה, שסביר להניח שהיו להם אמונות קודמות לגבי סוגי ההסמכות שמשויכים להצלחה בתוכנית למדעי המחשב. יכול להיות שהם אסף או הפכו את הנתונים בטעות, כך שהמודל אישר את האמונות הקיימות האלה.

הטיית אוטומציה

הטיה אוטומטית עשויה להסביר למה ועדת הקבלה בחרה להשתמש במודל למידת מכונה כדי לקבל החלטות לגבי קבלה. יכול להיות שהם האמינו שמערכת אוטומטית תניב תוצאות טובות יותר מאשר החלטות של בני אדם. עם זאת, הטיה של אוטומציה לא מספקת תובנות לגבי הסיבה לכך שהתחזיות של המודל היו מוטה.

מבוא (5 דקות)

זיהוי הטיה (10 דקות)

הוגנות: סוגי הטיה

הטיה בדיווח

הגדרה

דוגמה

הטיה היסטורית

הגדרה

דוגמה

הטיית אוטומציה

הגדרה

דוגמה

הטיה בבחירה

הטיית כיסוי

הגדרה

דוגמה

הטיה של אי-תגובה

הגדרה

דוגמה

הטיה בדגימה

הגדרה

דוגמה

הטיה בייחוס לקבוצה

הטיה בתוך הקבוצה

הגדרה

דוגמה

הטיה הומוגנית כלפי קבוצה חוץ

הגדרה

דוגמה

הטיה מרומזת

הגדרה

דוגמה

הטיית אישור

הגדרה

דוגמה

הטיה של מבצע הניסוי

הגדרה

דוגמה

תרגול: בדיקת ההבנה