نماذج تعلُّم الآلة (ML) ليست موضوعية في حد ذاتها. ممارسو تعلُّم الآلة لتدريب النماذج من خلال تزويدها بمجموعة بيانات من أمثلة التدريب، يمكن أن تساهم المشاركة في توفير هذه البيانات وتنظيمها في تحويل نموذج التنبؤات العرضية للتحيز.
عند بناء النماذج، من المهم أن تكون على دراية بالتحيزات البشرية الشائعة التي يمكن أن في بياناتك، حتى تتمكن من اتخاذ خطوات استباقية للتخفيف من التأثيرات.
الانحياز في إعداد التقارير
-
التعريف
يحدث تحيز إعداد التقارير عندما يحدث تكرار الأحداث و/أو الخصائص و/أو النتائج التي تم تسجيلها في مجموعة بيانات تعكس ترددها في العالم الحقيقي بدقة. يمكن أن ينشأ هذا التحيز لأن الناس يميلون إلى التركيز على توثيق الظروف غير عادية أو لا تُنسى بشكل خاص، بافتراض أن المألوف لا يجب تسجيلها.
-
مثال
يتم تدريب نموذج تحليل العاطفة على التنبؤ بما إذا كان كتاب تكون المراجعات إيجابية أو سلبية استنادًا إلى مجموعة المستخدمين عمليات الإرسال إلى موقع ويب مشهور. ومعظم المراجعات في مجموعة بيانات التدريب تعكس آراء متطرفة (المراجعون الذين كتابًا يحبه أو يكرهه)؛ لأنه يقل احتمال إرسال الأشخاص مراجعة لكتاب ما إذا لم يتم الرد عليه بشدة. نتيجة لذلك، أُنشئت مكتبة مات بلوت ليب في فإن النموذج أقل قدرة على التنبؤ بشكل صحيح المراجعات التي تستخدم لغة أكثر دقة لوصف أحد الكتب.
انقر فوق chevron_left للتعريف.
التحيز التاريخي
-
التعريف
يحدث الانحياز التاريخي عندما يتم استخدام البيانات السابقة يعكس عدم المساواة التي كانت موجودة في العالم في ذلك الوقت.
-
مثال
تحتوي مجموعة بيانات سكنية من ستينيات القرن الماضي على بيانات أسعار المنازل يعكس ممارسات الإقراض التمييزي السارية خلال تلك الفترة عقد.
انقر فوق chevron_left للتعريف.
تحيز التشغيل الآلي
-
التعريف
تحيز التشغيل الآلي هو ميل لتفضيل النتائج التي يتم إنشاؤها بواسطة الأنظمة الآلية على تلك التي يتم إنشاؤها بواسطة الأنظمة غير الآلية بغض النظر عن معدلات الخطأ لكلٍ منها.
-
مثال
كان ممارسو تعلُّم الآلة الذين يعملون في شركة تصنيع منتجات مسننة حريصين على نشر "رائد" جديد نموذج درّبوه لتحديد عيوب الأسنان، إلى أن أشار مشرف المصنع إلى أن وكانت معدلات دقة وتذكر النموذج أقل بنسبة 15% من تلك المعدلات المفتشين البشريين.
انقر فوق chevron_left للتعريف.
تحيز التحديد
يحدث التحيز الاختياري إذا كان أمثلة مجموعة البيانات بطريقة لا تعكس التوزيع الفعلي. يمكن أن يتخذ تحيز التحديد عدة أشكال مختلفة، بما في ذلك تحيز التغطية والتحيز عدم الاستجابة والتحيز في أخذ العينات.
انحياز في التغطية
-
التعريف
يحدث انحياز التغطية في حال عدم اختيار البيانات ضمن بطريقة تمثيلية.
-
مثال
يتم تدريب نموذج على التنبؤ بالمبيعات المستقبلية لمنتج جديد يستند إلى على الاستطلاعات عبر الهاتف التي أُجريَت مع عينة من المستهلكين الذين اشتروا المنتج. المستهلكون الذين اختاروا شراء منتج منافس بدلاً من ذلك الذين لم يتم استطلاع آرائهم، ونتيجةً لذلك، لم يتم تضمين هذه المجموعة من الأشخاص يتم تمثيلها في بيانات التدريب.
انقر فوق chevron_left للتعريف.
تحيز عدم الاستجابة
-
التعريف
الانحياز لعدم الاستجابة (يُعرف أيضًا باسم تحيز المشاركة) إذا أصبحت البيانات في نهاية المطاف غير تمثيلي بسبب فجوات المشاركة في جمع البيانات الدفع.
-
مثال
يتم تدريب نموذج على التنبؤ بالمبيعات المستقبلية لمنتج جديد يستند إلى على الاستطلاعات عبر الهاتف التي أُجريَت مع عينة من المستهلكين الذين اشتروا وعينة من المستهلكين الذين اشتروا منتجًا المنتج. كان المستهلكون الذين اشتروا المنتج المنافس أكثر بنسبة 80٪ احتمالية رفض إكمال الاستطلاع، وكانت بياناتهم محدودة التمثيل في العينة.
انقر فوق chevron_left للتعريف.
تحيز أخذ العينات
-
التعريف
يحدث تحيز أخذ العينات إذا تم التوزيع العشوائي المناسب لم يتم استخدامها أثناء جمع البيانات.
-
مثال
يتم تدريب نموذج على التنبؤ بالمبيعات المستقبلية لمنتج جديد يستند إلى على الاستطلاعات عبر الهاتف التي أُجريَت مع عينة من المستهلكين الذين اشتروا وعينة من المستهلكين الذين اشتروا منتجًا المنتج. وبدلاً من استهداف المستهلكين بشكل عشوائي، قام القائم بالاستطلاع أول 200 مستهلك ردوا على رسالة بريد إلكتروني، والذين قد كانوا أكثر حماسًا بشأن المنتج من المتوسط المشترين.
انقر فوق chevron_left للتعريف.
تحيز تحديد المصدر للمجموعة
الانحياز في تحديد مصدر المجموعة هو الميل لتعميم ما ينطبق على الأفراد على المجموعة بأكملها التي ينتمون إليها. غالبًا ما يظهر الانحياز في تحديد مصدر المجموعة في ما يلي: النماذج.
الانحياز داخل المجموعة
-
التعريف
التحيز داخل المجموعة هو تفضيل لأعضاء مجموعتك الخاصة التي تنتمي إليها أيضًا أو خصائص معيّنة التي تشاركها أيضًا.
-
مثال
اثنان من ممارسي تعلُّم الآلة يتدربان على نموذج فحص السيرة الذاتية يميل مطورو البرامج إلى الاعتقاد بأن المتقدمين الذين حضروا نفس أكاديمية علوم الكمبيوتر كما درسوا أكثر تأهلاً للوظيفة.
انقر فوق chevron_left للتعريف.
تحيز التجانس خارج المجموعة
-
التعريف
تحيز التجانس خارج المجموعة هو الميل إلى الصورة النمطية لأفراد مجموعة لا يجب عليك الانتماء، أو رؤية سماتها على أنها أكثر اتساقًا.
-
مثال
اثنان من ممارسي تعلُّم الآلة يتدربان على نموذج فحص السيرة الذاتية يميل مطورو البرمجيات إلى الاعتقاد بأن جميع المتقدمين الذين لم يذهبوا إلى أكاديمية علوم الكمبيوتر ليس لديهم الخبرة الكافية للدور.
انقر فوق chevron_left للتعريف.
التحيز الضمني
-
التعريف
يحدث التحيز الضمني عند وضع الافتراضات استنادًا إلى نموذج تفكير الفرد وخبراته الشخصية لا تنطبق بالضرورة بشكل عام.
-
مثال
يستخدم ممارس لتعلُّم الآلة أثناء تدريب نموذج التعرّف على الإيماءات هزّ الرأس ميزة تشير إلى أن شخصًا يوصل كلمة "لا". إلا أن هز الرأس في بعض مناطق العالم تشير إلى "نعم".
انقر فوق chevron_left للتعريف.
التحيز التأكيدي
-
التعريف
يحدث الانحياز التأكيدي عندما تنشئ منصات إنشاء النماذج. معالجة البيانات دون وعي بطرق تؤكد المعتقدات الموجودة مسبقًا والفرضيات.
-
مثال
يقوم ممارس تعلُّم الآلة بإنشاء نموذج يتنبأ بالعدوانية في الكلاب على أساس مجموعة متنوعة من الخصائص (الطول والوزن والسلالة بيئية). لقد واجه الممارس لقاءً غير سارة مع لكلب البودل الصغير النشاط الزائد في طفولته، وقد ارتبط منذ ذلك الحين السلالة بالعدوانية. عند تنظيم بيانات تدريب النموذج، تجاهل الممارس عمدًا السمات التي قدمت دليل على التعقيد في الكلاب الأصغر.
انقر فوق chevron_left للتعريف.
تحيز المجرّب
-
التعريف
يحدث تحيز المجرب عندما تكون إحدى أدوات إنشاء النماذج مواصلة تدريب أي نموذج حتى ينتج نتيجة تتوافق مع فرضيته الأصلية.
-
مثال
يقوم ممارس تعلُّم الآلة بإنشاء نموذج يتنبأ بالعدوانية في الكلاب على أساس مجموعة متنوعة من الخصائص (الطول والوزن والسلالة بيئية). لقد واجه الممارس لقاءً غير سارة مع لكلب البودل الصغير النشاط الزائد في طفولته، وقد ارتبط منذ ذلك الحين السلالة بالعدوانية. متى توقع النموذج المدرَّب أكثر كلاب البودل أن تكون مرحة نسبيًا، وقد تمت إعادة تدريب الممارس النموذج عدة مرات أخرى حتى ينتج نتيجة تظهر كلاب بودل أصغر حجمًا لتكون أكثر عنفًا.
انقر فوق chevron_left للتعريف.