مسرد تعلُّم الآلة: الذكاء الاصطناعي المسؤول

تحتوي هذه الصفحة على مصطلحات مسرد الذكاء الاصطناعي المسؤول. للاطّلاع على جميع مصطلحات المسرد، يُرجى النقر هنا.

A

السمة

#responsible

مرادف ميزة

في سياق عدالة تعلُّم الآلة، تشير السمات غالبًا إلى الخصائص المتعلقة بالأفراد.

الانحياز للاقتراحات الآلية

#responsible

عندما يفضّل صانع القرار البشري الاقتراحات التي تقدّمها أنظمة آلية لاتخاذ القرارات على المعلومات التي يتم جمعها بدون استخدام أنظمة آلية، حتى عندما ترتكب هذه الأنظمة أخطاءً

لمزيد من المعلومات، يُرجى الاطّلاع على الإنصاف: أنواع التحيز في "الدورة التدريبية المكثّفة حول تعلُّم الآلة".

B

التحيّز (الأخلاقيات/الإنصاف)

#responsible
#fundamentals

1. الصور النمطية أو التحيز أو المحاباة تجاه بعض الأشياء أو الأشخاص أو المجموعات دون غيرها يمكن أن تؤثّر هذه الانحيازات في جمع البيانات وتفسيرها، وفي تصميم النظام، وفي طريقة تفاعل المستخدمين مع النظام. تشمل أشكال هذا النوع من التحيز ما يلي:

2. خطأ منهجي ناتج عن إجراءات أخذ العيّنات أو إعداد التقارير تشمل أشكال هذا النوع من التحيز ما يلي:

يجب عدم الخلط بين هذا المفهوم ومصطلح التحيز في نماذج تعلُّم الآلة أو التحيز في التوقعات.

يمكنك الاطّلاع على الإنصاف: أنواع التحيز في "الدورة التدريبية المكثّفة حول تعلُّم الآلة" للحصول على مزيد من المعلومات.

C

الانحياز التأكيدي

#responsible

الميل إلى البحث عن المعلومات وتفسيرها وتفضيلها وتذكُّرها بطريقة تؤكد صحة المعتقدات أو الفرضيات الموجودة مسبقًا قد يجمع مطوّرو تعلُّم الآلة البيانات أو يصنّفونها عن غير قصد بطرق تؤثّر في نتيجة تدعم معتقداتهم الحالية. التحيز التأكيدي هو شكل من أشكال التحيز الضمني.

تحيّز المجرب هو شكل من أشكال التحيز التأكيدي، حيث يواصل المجرب تدريب النماذج إلى أن يتم تأكيد فرضية موجودة مسبقًا.

العدالة في حالة عدم توفّر الحقائق

#responsible
#Metric

مقياس الإنصاف الذي يتحقّق مما إذا كان نموذج التصنيف يعرض النتيجة نفسها لشخص ما كما يعرضها لشخص آخر مطابق للأول، باستثناء ما يتعلق بواحدة أو أكثر من السمات الحسّاسة. يُعدّ تقييم نموذج التصنيف من حيث العدالة الواقعية الافتراضية إحدى الطرق للكشف عن المصادر المحتملة للتحيّز في النموذج.

يمكنك الاطّلاع على أيّ مما يلي لمزيد من المعلومات:

انحياز في التغطية

#responsible

اطّلِع على الانحياز في الاختيار.

D

التكافؤ الديمغرافي

#responsible
#Metric

مقياس العدالة الذي يتم استيفاؤه إذا كانت نتائج تصنيف النموذج لا تعتمد على سمة حساسة معيّنة.

على سبيل المثال، إذا كان كل من سكان ليليبوت وبروبدينغناغ يتقدّمون بطلبات إلى جامعة غلوبدوبدريب، يتم تحقيق التكافؤ الديموغرافي إذا كانت النسبة المئوية للطلاب المقبولين من ليليبوت هي نفسها النسبة المئوية للطلاب المقبولين من بروبدينغناغ، بغض النظر عمّا إذا كانت إحدى المجموعتين أكثر تأهيلاً من الأخرى في المتوسط.

يختلف هذا المقياس عن التكافؤ في الاحتمالات وتكافؤ الفرص، اللذين يسمحان بأن تعتمد نتائج التصنيف بشكل إجمالي على السمات الحسّاسة، ولكنّهما لا يسمحان بأن تعتمد نتائج التصنيف لبعض تصنيفات الحقيقة الأساسية المحدّدة على السمات الحسّاسة. يمكنك الاطّلاع على "مكافحة التمييز باستخدام تكنولوجيا تعلُّم الآلة الأذكى" للحصول على رسم توضيحي يستعرض المفاضلة بين الخيارات عند تحسين التكافؤ الديمغرافي.

يمكنك الاطّلاع على الإنصاف: التكافؤ الديمغرافي في "دورة مكثّفة عن تعلّم الآلة" للحصول على مزيد من المعلومات.

التأثير غير المتكافئ

#responsible

اتّخاذ قرارات بشأن أشخاص تؤثّر بشكل غير متناسب في مجموعات فرعية مختلفة من السكان يشير ذلك عادةً إلى الحالات التي تؤدي فيها عملية اتخاذ القرارات المستندة إلى الخوارزميات إلى إلحاق الضرر ببعض المجموعات الفرعية أو إفادتها أكثر من غيرها.

على سبيل المثال، لنفترض أنّ خوارزمية تحدّد أهلية شخص من ليليبوت للحصول على قرض لشراء منزل صغير، ومن المرجّح أن تصنّفه على أنّه "غير مؤهّل" إذا كان عنوانه البريدي يتضمّن رمزًا بريديًا معيّنًا. إذا كان من المرجّح أن يكون لدى سكان ليليبوت الذين يستخدمون نظام Big-Endian عناوين بريدية تتضمّن هذا الرمز البريدي أكثر من سكان ليليبوت الذين يستخدمون نظام Little-Endian، قد تؤدي هذه الخوارزمية إلى تأثير متفاوت.

يختلف ذلك عن المعاملة غير المتكافئة، التي تركّز على التفاوتات الناتجة عندما تكون خصائص المجموعة الفرعية مدخلات صريحة في عملية اتخاذ القرار المستندة إلى الخوارزميات.

المعاملة غير المتكافئة

#responsible

إدخال السمات الحسّاسة الخاصة بالأشخاص في عملية اتخاذ القرار المستندة إلى الخوارزميات، ما يؤدي إلى معاملة المجموعات الفرعية المختلفة من الأشخاص بشكل مختلف

على سبيل المثال، لنفترض أنّ هناك خوارزمية تحدّد أهلية الأشخاص للحصول على قرض لشراء منزل صغير استنادًا إلى البيانات التي يقدّمونها في طلب القرض. إذا كانت الخوارزمية تستخدم انتماء أحد الأشخاص إلى Lilliputian كإدخال Big-Endian أو Little-Endian، فإنّها تمارس معاملة مختلفة على هذا الأساس.

يختلف ذلك عن التأثير غير المتكافئ الذي يركّز على التفاوتات في التأثيرات المجتمعية للقرارات الخوارزمية على المجموعات الفرعية، بغض النظر عمّا إذا كانت هذه المجموعات الفرعية مدخلات للنموذج.

E

تكافؤ الفرص

#responsible
#Metric

مقياس الإنصاف لتقييم ما إذا كان النموذج يتوقّع النتيجة المطلوبة بشكل جيد وبالمقدار نفسه لجميع قيم السمة الحسّاسة. بعبارة أخرى، إذا كانت النتيجة المرغوبة لنموذج هي الفئة الموجبة، سيكون الهدف هو أن يكون معدّل الإيجابية الحقيقية هو نفسه لجميع المجموعات.

يرتبط تكافؤ الفرص بتكافؤ الاحتمالات، الذي يتطلّب أن يكون كلّ من معدلات الموجب الصائب ومعدلات الموجب الخاطئ متطابقًا لجميع المجموعات.

لنفترض أنّ جامعة Glubbdubdrib تقبل طلابًا من Lilliput وBrobdingnag في برنامج رياضيات صارم. تقدّم المدارس الثانوية في ليليبوت منهجًا دراسيًا قويًا في الرياضيات، ومعظم الطلاب مؤهّلون للالتحاق بالبرنامج الجامعي. لا تقدّم المدارس الثانوية في بروبدينغناغ دروسًا في الرياضيات على الإطلاق، ونتيجةً لذلك، يكون عدد الطلاب المؤهّلين أقل بكثير. تتحقّق المساواة في الفرص بالنسبة إلى التصنيف المفضّل "مقبول" فيما يتعلّق بالجنسية (ليليبوتية أو بروبدينغناغية) إذا كان الطلاب المؤهّلون متساوون في فرص القبول بغض النظر عمّا إذا كانوا ليليبوتايين أو بروبدينغناغيين.

على سبيل المثال، لنفترض أنّ 100 شخص من ليليبوت و100 شخص من بروبدينغناغ يقدّمون طلبات التحاق بجامعة غلوبدبدريب، ويتم اتخاذ قرارات القبول على النحو التالي:

الجدول 1. مقدّمو الطلبات من ليليبوت (90% منهم مؤهّلون)

  مؤهَّل غير معرَّف
تم قبول الطلب 45 3
تم الرفض 45 7
المجموع 90 10
النسبة المئوية للطلاب المؤهّلين المقبولين: 45/90 =%50
النسبة المئوية للطلاب غير المؤهّلين المرفوضين: 7/10 =%70
النسبة المئوية الإجمالية للطلاب المقبولين من ليليبوت: (45+3)/100 = %48

 

الجدول 2. مقدّمو الطلبات من Brobdingnagian (10% مؤهَّلون):

  مؤهَّل غير معرَّف
تم قبول الطلب 5 9
تم الرفض 5 81
المجموع 10 90
نسبة الطلاب المؤهّلين المقبولين: 5/10 =%50
نسبة الطلاب غير المؤهّلين المرفوضين: 81/90 =%90
النسبة الإجمالية للطلاب المقبولين من Brobdingnagian: (5+9)/100 = %14

تستوفي الأمثلة السابقة شرط تكافؤ الفرص لقبول الطلاب المؤهّلين، لأنّ كلّاً من سكان ليليبوت وبروبدينغناغ المؤهّلين لديهم فرصة بنسبة% 50 للقبول.

على الرغم من استيفاء شرط تكافؤ الفرص، لا يتم استيفاء مقياسَي العدالة التاليَين:

  • التكافؤ الديمغرافي: يتم قبول سكان ليليبوت وبروبدينغناغ في الجامعة بمعدلات مختلفة، إذ يتم قبول% 48 من الطلاب من ليليبوت، ولكن يتم قبول% 14 فقط من الطلاب من بروبدينغناغ.
  • تكافؤ الفرص: على الرغم من أنّ الطلاب المؤهَّلين من ليليبوت وبروبدينغناغ لديهم فرصة متساوية للقبول، لا يتم استيفاء الشرط الإضافي الذي ينص على أنّ الطلاب غير المؤهَّلين من ليليبوت وبروبدينغناغ لديهم فرصة متساوية للرفض. تبلغ نسبة الرفض لدى Lilliputians غير المؤهّلين% 70، بينما تبلغ نسبة الرفض لدى Brobdingnagians غير المؤهّلين% 90.

يمكنك الاطّلاع على الإنصاف: تكافؤ الفرص في "دورة مكثّفة عن تعلّم الآلة" للحصول على مزيد من المعلومات.

المعدّلات المتساوية

#responsible
#Metric

مقياس عدالة لتقييم ما إذا كان النموذج يتنبأ بالنتائج بشكل جيد وبالمثل لجميع قيم السمة الحسّاسة فيما يتعلق بكل من الفئة الموجبة والفئة السالبة، وليس فئة واحدة أو الأخرى حصريًا. بعبارة أخرى، يجب أن يكون كل من معدّل الموجب الصائب ومعدّل السالب الخاطئ متساويَين بالنسبة إلى جميع المجموعات.

تتعلّق تكافؤ الفرص بالمساواة في الفرص، التي تركّز فقط على معدّلات الخطأ لفئة واحدة (موجبة أو سالبة).

على سبيل المثال، لنفترض أنّ جامعة Glubbdubdrib تقبل الطلاب من Lilliput وBrobdingnag في برنامج رياضيات صارم. تقدّم المدارس الثانوية في ليليبوت منهجًا دراسيًا قويًا في الرياضيات، ومعظم الطلاب مؤهّلون للالتحاق بالبرنامج الجامعي. لا تقدّم المدارس الثانوية في بروبدينغناغ دروسًا في الرياضيات على الإطلاق، ونتيجةً لذلك، يكون عدد الطلاب المؤهّلين أقل بكثير. يتم استيفاء شرط تكافؤ الفرص إذا كان احتمال قبول المتقدّمين المؤهّلين في البرنامج متساويًا بغض النظر عن حجمهم، وإذا كان احتمال رفض المتقدّمين غير المؤهّلين متساويًا بغض النظر عن حجمهم.

لنفترض أنّ 100 شخص من ليليبوت و100 شخص من بروبدينغناغ يقدّمون طلبات إلى جامعة غلوبدوبدريب، ويتم اتخاذ قرارات القبول على النحو التالي:

الجدول 3. مقدّمو الطلبات من ليليبوت (90% منهم مؤهّلون)

  مؤهَّل غير معرَّف
تم قبول الطلب 45 2
تم الرفض 45 8
المجموع 90 10
نسبة الطلاب المؤهّلين المقبولين: 45/90 =%50
نسبة الطلاب غير المؤهّلين المرفوضين: 8/10 =%80
النسبة الإجمالية للطلاب المقبولين من Lilliputian: (45+2)/100 = %47

 

الجدول 4. مقدّمو الطلبات من Brobdingnagian (10% مؤهَّلون):

  مؤهَّل غير معرَّف
تم قبول الطلب 5 18
تم الرفض 5 72
المجموع 10 90
نسبة الطلاب المؤهّلين المقبولين: 5/10 =%50
نسبة الطلاب غير المؤهّلين المرفوضين: 72/90 =%80
النسبة الإجمالية للطلاب المقبولين من Brobdingnagian: (5+18)/100 = %23

يتم استيفاء شرط تكافؤ الفرص لأنّ الطلاب المؤهّلين من ليليبوت وبروبدينغناغ لديهم فرصة متساوية بنسبة% 50 للقبول، بينما الطلاب غير المؤهّلين من ليليبوت وبروبدينغناغ لديهم فرصة متساوية بنسبة% 80 للرفض.

يتم تعريف تكافؤ الفرص رسميًا في "تكافؤ الفرص في التعلّم الخاضع للإشراف" على النحو التالي: "يتوافق المتنبئ Ŷ مع تكافؤ الفرص فيما يتعلق بالسمة المحمية A والنتيجة Y إذا كان Ŷ وA مستقلين، بشرط Y".

انحياز المُختبِر

#responsible

اطّلِع على التحيز التأكيدي.

F

قيد الإنصاف

#responsible
تطبيق قيد على خوارزمية لضمان استيفاء تعريف واحد أو أكثر للإنصاف تشمل أمثلة قيود العدالة ما يلي:

مقياس العدالة

#responsible
#Metric

تعريف رياضي لمفهوم "الإنصاف" يمكن قياسه. تشمل بعض مقاييس العدالة الشائعة الاستخدام ما يلي:

تتداخل العديد من مقاييس العدالة مع بعضها البعض، راجِع عدم توافق مقاييس العدالة.

G

الانحياز لتشابه المجموعة

#responsible

افتراض أنّ ما ينطبق على فرد ينطبق أيضًا على جميع أفراد المجموعة يمكن أن تتفاقم آثار تحيّز تحديد المصدر حسب المجموعة إذا تم استخدام أخذ العيّنات حسب الملاءمة لجمع البيانات. في عينة غير تمثيلية، قد يتم تقديم سمات لا تعكس الواقع.

اطّلِع أيضًا على الانحياز للتشابه خارج المجموعة والانحياز داخل المجموعة. يمكنك أيضًا الاطّلاع على الإنصاف: أنواع التحيز في "دورة تدريبية مكثّفة حول تعلُّم الآلة" للحصول على مزيد من المعلومات.

H

التحيّز التاريخي

#responsible

هو نوع من التحيّز الموجود في العالم والذي تم تضمينه في مجموعة بيانات. وتميل هذه التحيزات إلى عكس الصور النمطية الثقافية الحالية، وعدم المساواة الديمغرافية، والتحيزات ضد مجموعات اجتماعية معيّنة.

على سبيل المثال، لنفترض نموذج تصنيف يتنبأ بما إذا كان مقدّم طلب القرض سيتخلّف عن سداد القرض أم لا، وقد تم تدريبه على بيانات سابقة عن التخلّف عن سداد القروض من الثمانينيات من البنوك المحلية في منطقتَين مختلفتَين. إذا كان احتمال تخلّف المتقدّمين من "المجموعة أ" عن سداد قروضهم أكبر بست مرات من احتمال تخلّف المتقدّمين من "المجموعة ب"، قد يتعلّم النموذج تحيّزًا تاريخيًا يؤدي إلى انخفاض احتمال موافقة النموذج على القروض في "المجموعة أ"، حتى إذا لم تعُد الشروط التاريخية التي أدّت إلى ارتفاع معدلات التخلّف عن السداد في هذه المجموعة ذات صلة.

لمزيد من المعلومات، يُرجى الاطّلاع على الإنصاف: أنواع التحيز في "الدورة التدريبية المكثّفة حول تعلُّم الآلة".

I

التحيّز الضمني

#responsible

تكوين ارتباط أو افتراض تلقائيًا استنادًا إلى نماذج وذكريات العقل يمكن أن يؤثر التحيز الضمني في ما يلي:

  • كيفية جمع البيانات وتصنيفها
  • طريقة تصميم وتطوير أنظمة تعلُّم الآلة

على سبيل المثال، عند إنشاء نموذج تصنيف للتعرّف على صور حفلات الزفاف، قد يستخدم أحد المهندسين ظهور فستان أبيض في الصورة كإحدى السمات. ومع ذلك، لم تكن الفساتين البيضاء من العادات إلا خلال عصور معيّنة وفي ثقافات معيّنة.

اطّلِع أيضًا على التحيّز التأكيدي.

عدم توافق مقاييس الإنصاف

#responsible
#Metric

تشير إلى فكرة أنّ بعض مفاهيم العدالة غير متوافقة مع بعضها البعض ولا يمكن تحقيقها في الوقت نفسه. نتيجةً لذلك، لا يوجد مقياس عالمي واحد لتحديد مدى العدل يمكن تطبيقه على جميع مشاكل تعلُّم الآلة.

على الرغم من أنّ ذلك قد يبدو محبطًا، إلا أنّ عدم التوافق بين مقاييس العدالة لا يعني أنّ الجهود المبذولة لتحقيق العدالة غير مثمرة. بدلاً من ذلك، يقترح أنّه يجب تحديد العدالة حسب السياق لمشكلة تعلّم آلي معيّنة، بهدف منع الأضرار المرتبطة بحالات الاستخدام المحدّدة.

يمكنك الاطّلاع على مقالة "حول إمكانية تحقيق العدالة" للحصول على مناقشة أكثر تفصيلاً حول عدم توافق مقاييس العدالة.

العدالة الفردية

#responsible
#Metric

مقياس عدالة يتحقّق مما إذا تم تصنيف الأفراد المتشابهين بشكل مماثل. على سبيل المثال، قد ترغب أكاديمية Brobdingnagian في تحقيق العدالة الفردية من خلال ضمان أنّ فرص قبول طالبَين متطابقَين في الدرجات ونتائج الاختبارات الموحّدة متساوية.

يُرجى العِلم أنّ العدالة الفردية تعتمد بشكل كامل على طريقة تحديد "التشابه" (في هذه الحالة، الدرجات ونتائج الاختبارات)، وقد تواجه خطر حدوث مشاكل جديدة في العدالة إذا لم يتضمّن مقياس التشابه معلومات مهمة (مثل مدى صعوبة المناهج الدراسية للطالب).

يمكنك الاطّلاع على "العدالة من خلال الوعي" للحصول على مناقشة أكثر تفصيلاً حول العدالة الفردية.

الانحياز لأفراد المجموعة

#responsible

إظهار التحيز لمجموعة الفرد أو خصائصه إذا كان المختبِرون أو المقيمون من أصدقاء مطوّر تعلُّم الآلة أو أفراد عائلته أو زملاء عمله، قد يؤدي التحيز داخل المجموعة إلى إبطال اختبار المنتج أو مجموعة البيانات.

الانحياز لأفراد المجموعة هو شكل من أشكال الانحياز لتشابه المجموعة. اطّلِع أيضًا على الانحياز للتشابه خارج المجموعة.

يمكنك الاطّلاع على الإنصاف: أنواع التحيز في "الدورة التدريبية المكثّفة حول تعلُّم الآلة" للحصول على مزيد من المعلومات.

لا

الانحياز لعدم الإجابة

#responsible

اطّلِع على الانحياز في الاختيار.

O

الانحياز للتشابه خارج المجموعة

#responsible

الميل إلى اعتبار أعضاء المجموعة الخارجية أكثر تشابهًا من أعضاء المجموعة الداخلية عند مقارنة المواقف والقيم والسمات الشخصية وغيرها من الخصائص يشير مصطلح داخل المجموعة إلى الأشخاص الذين تتفاعل معهم بانتظام، بينما يشير مصطلح خارج المجموعة إلى الأشخاص الذين لا تتفاعل معهم بانتظام. إذا أنشأت مجموعة بيانات من خلال الطلب من المشاركين تقديم سمات حول المجموعات الخارجية، قد تكون هذه السمات أقل دقة وأكثر نمطية من السمات التي يدرجها المشاركون للأشخاص في مجموعتهم الداخلية.

على سبيل المثال، قد يصف سكان ليليبوت منازل بعضهم البعض بتفصيل كبير، مع الإشارة إلى اختلافات بسيطة في الأساليب المعمارية والنوافذ والأبواب والأحجام. ومع ذلك، قد يزعم الأقزام أن جميع العمالقة يعيشون في منازل متطابقة.

الانحياز للتشابه خارج المجموعة هو شكل من أشكال الانحياز لتشابه المجموعة.

يمكنك أيضًا الاطّلاع على الانحياز لأفراد المجموعة.

P

انحياز المشاركة

#responsible

مرادف للانحياز لعدم الإجابة اطّلِع على الانحياز في الاختيار.

المعالجة اللاحقة

#responsible
#fundamentals

تعديل ناتج النموذج بعد تشغيله يمكن استخدام المعالجة اللاحقة لفرض قيود العدالة بدون تعديل النماذج نفسها.

على سبيل المثال، يمكن تطبيق المعالجة اللاحقة على نموذج التصنيف الثنائي من خلال ضبط حدّ التصنيف، وذلك للحفاظ على تكافؤ الفرص لبعض السمات من خلال التأكّد من أنّ معدّل الإيجابية الحقيقية هو نفسه لجميع قيم تلك السمة.

التكافؤ التوقّعي

#responsible
#Metric

مقياس الإنصاف يتحقّق مما إذا كانت معدّلات الدقة متساوية للمجموعات الفرعية قيد الدراسة في نموذج تصنيف معيّن.

على سبيل المثال، إذا كان هناك نموذج يتوقّع قبول الطلاب في الكلية، سيحقّق هذا النموذج تكافؤ التوقّعات بالنسبة إلى الجنسية إذا كان معدّل دقته متساويًا بالنسبة إلى الأشخاص من ليليبوت وبروبدينغناغ.

يُطلق على ميزة "تطابق الأسعار التوقّعية" أحيانًا اسم تطابق الأسعار التوقّعية.

يمكنك الاطّلاع على "تعريفات العدالة الموضّحة" (الفقرة 3.2.1) للحصول على مناقشة أكثر تفصيلاً حول التكافؤ التوقعي.

ميزة "تساوي الأسعار التوقّعي"

#responsible
#Metric

اسم آخر للتكافؤ التوقعي

المعالجة المُسبَقة

#responsible
معالجة البيانات قبل استخدامها لتدريب نموذج يمكن أن تكون المعالجة المسبقة بسيطة، مثل إزالة الكلمات من مجموعة نصوص باللغة الإنجليزية غير متوفرة في قاموس اللغة الإنجليزية، أو معقّدة، مثل إعادة التعبير عن نقاط البيانات بطريقة تزيل أكبر عدد ممكن من السمات المرتبطة بالسمات الحسّاسة. يمكن أن تساعد المعالجة المُسبقة في استيفاء قيود الإنصاف.

الوكيل (السمات الحسّاسة)

#responsible
سمة مستخدَمة كبديل لسمة حساسة على سبيل المثال، يمكن استخدام الرمز البريدي الخاص بفرد كبديل للدخل أو العِرق أو الأصل الإثني.

R

الانحياز لتكرار التقارير

#responsible

إنّ معدّل تكرار كتابة الأشخاص عن إجراءات أو نتائج أو سمات معيّنة لا يعكس معدّل تكرارها في الواقع أو مدى ارتباط سمة معيّنة بفئة من الأفراد. يمكن أن يؤثر التحيز في إعداد التقارير في تركيبة البيانات التي تتعلّم منها أنظمة تعلُّم الآلة.

على سبيل المثال، في الكتب، تكون الكلمة ضحك أكثر شيوعًا من الكلمة تنفس. من المرجّح أن يحدّد نموذج تعلُّم آلي يقدّر التكرار النسبي للضحك والتنفّس من مجموعة نصوص أنّ الضحك أكثر شيوعًا من التنفّس.

لمزيد من المعلومات، يمكنك الاطّلاع على الإنصاف: أنواع التحيز في "الدورة التدريبية المكثّفة حول تعلُّم الآلة".

S

الانحياز في أخذ العينات

#responsible

اطّلِع على الانحياز في الاختيار.

الانحياز في الاختيار

#responsible

أخطاء في الاستنتاجات المستخلَصة من البيانات المستندة إلى عيّنات بسبب عملية اختيار تؤدي إلى اختلافات منهجية بين العيّنات المرصودة في البيانات والعيّنات غير المرصودة تتوفّر أشكال التحيز في الاختيار التالية:

  • تحيز التغطية: لا تتطابق المجموعة الإحصائية الممثَّلة في مجموعة البيانات مع المجموعة الإحصائية التي يتوقّعها نموذج تعلُّم الآلة.
  • تحيّز أخذ العينات: لا يتم جمع البيانات بشكل عشوائي من المجموعة المستهدَفة.
  • تحيّز عدم الاستجابة (يُعرف أيضًا باسم تحيّز المشاركة): يختار المستخدمون من مجموعات معيّنة عدم المشاركة في الاستطلاعات بمعدلات مختلفة عن المستخدمين من مجموعات أخرى.

على سبيل المثال، لنفترض أنّك بصدد إنشاء نموذج لتعلُّم الآلة يتوقّع مدى استمتاع الأشخاص بفيلم معيّن. لجمع بيانات التدريب، توزّع استطلاعًا على كل شخص في الصف الأمامي من قاعة سينما تعرض الفيلم. قد تبدو هذه الطريقة معقولة للوهلة الأولى لجمع مجموعة بيانات، ولكن قد يؤدي هذا النوع من جمع البيانات إلى حدوث أشكال التحيز التالية عند الاختيار:

  • تحيّز التغطية: من خلال أخذ عيّنات من مجموعة من الأشخاص الذين اختاروا مشاهدة الفيلم، قد لا تكون توقّعات نموذجك قابلة للتعميم على الأشخاص الذين لم يعبّروا عن هذا المستوى من الاهتمام بالفيلم.
  • تحيّز أخذ العيّنات: بدلاً من أخذ عيّنات عشوائية من المجموعة المستهدَفة (جميع الأشخاص في السينما)، أخذت عيّنات من الأشخاص في الصف الأمامي فقط. من المحتمل أنّ الأشخاص الجالسين في الصف الأمامي كانوا أكثر اهتمامًا بالفيلم من الأشخاص الجالسين في الصفوف الأخرى.
  • تحيّز عدم الاستجابة: بشكل عام، يميل الأشخاص الذين لديهم آراء قوية إلى الرد على الاستطلاعات الاختيارية بشكل متكرر أكثر من الأشخاص الذين لديهم آراء معتدلة. بما أنّ استطلاع الأفلام اختياري، من المرجّح أن تشكّل الردود توزيعًا ثنائي المنوال بدلاً من التوزيع الطبيعي (على شكل جرس).

سمة حسّاسة

#responsible
سمة بشرية قد تُمنح اعتبارًا خاصًا لأسباب قانونية أو أخلاقية أو اجتماعية أو شخصية

U

عدم الوعي (بإحدى السمات الحسّاسة)

#responsible

حالة تتوفّر فيها سمات حسّاسة، ولكنّها غير مضمّنة في بيانات التدريب. بما أنّ السمات الحساسة غالبًا ما تكون مرتبطة بسمات أخرى خاصة ببيانات المستخدم، فإنّ النموذج الذي تم تدريبه بدون معرفة سمة حساسة قد يظل له تأثير غير متكافئ فيما يتعلق بهذه السمة، أو ينتهك قيود العدالة الأخرى.