في القسم السابق، قمنا بتقييم نموذج القبول لدينا من أجل الإنصاف باستخدام التكافؤ الديموغرافي، من خلال مقارنة معدلات القبول الإجمالية لكليهما المجموعات الديموغرافية.
وبدلاً من ذلك، يمكننا مقارنة معدلات القبول للمؤهلين فقط المرشحين في مجموعة الأغلبية والأقلية. إذا كانت معدلات القبول للطلاب المؤهلين في كلتا المجموعتين متساويتين، ويعرض النموذج تكافؤ الفرص: للطلاب الذين يحملون التصنيف المفضل لدينا ("المؤهلون للالتحاق") لديهم قيم متساوية فرصة الانضمام، بغض النظر عن المجموعة الديموغرافية التي ينتمي إليها إليه.
دعنا نعيد النظر في مجموعة المرشحين من القسم السابق:
المجموعة الأغلبية | مجموعة الأقلية | |
---|---|---|
مؤهَّل | 35 | 15 |
غير مؤهَّلة | 45 | 5 |
لنفترض أن نموذج القبول يقبل 14 مرشحًا من مجموعة الأغلبية و6 مرشحين من مجموعة الأقلية. تلبي قرارات النموذج وتكافؤ الفرص، مثل معدل القبول لكل من الأغلبية المؤهلة وتبلغ نسبة المرشحين من الأقليات المؤهلة هي 40%.
يحدد الجدول التالي الأرقام التي تدعم القيم المرفوضة والمقبولة المرشحين في الشكل 4.
المجموعة الأغلبية | مجموعة الأقلية | |||
---|---|---|---|---|
عدد الرسائل المقبولة | تم الرفض | عدد الرسائل المقبولة | تم الرفض | |
مؤهَّل | 14 | 21 | 6 | 9 |
غير مؤهَّلة | 0 | 45 | 0 | 5 |
الفوائد والعيوب
تتمثل الفائدة الرئيسية لتساوي الفرص في أنها تتيح نسبة التوقعات الإيجابية إلى السلبية لتختلف بين المجموعات الديموغرافية، بشرط أن يكون النموذج ناجحًا بنفس القدر في توقع التصنيف المفضل ("مؤهّل للالتحاق") لكلا المجموعتين.
لا تستوفي توقعات النماذج في الشكل 4 التكافؤ الديموغرافي، كطالب في المجموعة الأغلبية، تحظى بفرصة قبول 17.5٪، وطالب في مجموعة الأقليات بفرصة قبوله بنسبة 30٪. ومع ذلك، لدى الطالب المؤهل فرصة 40% للقبول، بغض النظر عن المجموعة التي ينتمي إليها، ويمكن القول إنها نتيجة أكثر إنصافًا في هذا في حالة استخدام نموذج معين.
من عيوب عدم تكافؤ الفرص أنها مصممة للاستخدام الحالات التي يوجد فيها تسمية مفضلة واضحة. إذا كان من المهم بنفس القدر أن يتنبأ النموذج بالفئة الموجبة ("المؤهلة للإدخال") والفئة السلبية ("غير مؤهلة للقبول") لجميع المجموعات الديموغرافية، قد يكون من المنطقي استخدام المقياس بدلاً من ذلك الاحتمالات المتساوية، التي تفرض معدلات نجاح متساوية لكلا التصنيفين.
عيب آخر لتكافؤ الفرص هو أنها يقيّم الإنصاف
من خلال مقارنة معدلات الخطأ إجمالاً للفئات الديموغرافية، والتي قد
لا يكون ممكنًا دائمًا. على سبيل المثال، إذا كانت مجموعة بيانات نموذج القبول لدينا
على ميزة demographic_group
، فلن يكون من الممكن
تقسيم معدلات القبول للمرشحين المؤهلين والأغلبية
ومقارنتها لمعرفة ما إذا كانت تكافؤ الفرص راضية.
في القسم التالي، سنلقي نظرة على مقياس آخر من مقاييس الإنصاف والإنصاف، الذي يمكن استخدامه في السيناريوهات التي لا تتوفر فيها البيانات الديموغرافية الموجودة لجميع الأمثلة.
تمرين: التحقق من فهمك
من الممكن أن ترضي توقعات أحد النماذج كلاً من الخصائص الديمغرافية المساواة وتكافؤ الفرص.
ولنفترض، على سبيل المثال، أنّ المصنِّف الثنائي (الذي يفضّل تصنيفه هي الفئة الموجبة) يتم تقييمها في 100 مثال، وتتوفر نتائج كما هو موضح في مصفوفات الالتباس التالية، مُقسمة حسب المجموعة الديموغرافية (الأغلبية والأقلية):
المجموعة الأغلبية | مجموعة الأقلية | |||
---|---|---|---|---|
القيمة الإيجابية المتوقَّعة | نتيجة سلبية متوقعة | القيمة الإيجابية المتوقَّعة | نتيجة سلبية متوقعة | |
الإيجابية الفعلية | 6 | 12 | 3 | 6 |
السلبية الفعلية | 10 | 36 | 6 | 21 |
\(\text{Positive Rate} = \frac{6+10}{6+10+12+36} = \frac{16}{64} = \text{25%}\) \(\text{True Positive Rate} = \frac{6}{6+12} = \frac{6}{18} = \text{33%}\) |
\(\text{Positive Rate} = \frac{3+6}{3+6+6+21} = \frac{9}{36} = \text{25%}\) \(\text{True Positive Rate} = \frac{3}{3+6} = \frac{3}{9} = \text{33%}\) |
كل من مجموعات الأغلبية والأقليات لديها معدل تنبؤ إيجابي بنسبة 25٪، مع تحقيق التكافؤ الديموغرافي، ومعدل إيجابي حقيقي (النسبة المئوية للأمثلة ذات التصنيف المفضل والتي تكون مصنفة بشكل صحيح) بنسبة 33٪، وهو ما يُرضي تكافؤ الفرص.