انصاف: انصاف خلاف واقع

تا کنون، بحث های ما در مورد معیارهای انصاف فرض شده است که نمونه های آموزشی و آزمایشی ما حاوی داده های جمعیت شناختی جامع برای زیرگروه های جمعیتی مورد ارزیابی است. اما اغلب اینطور نیست.

فرض کنید مجموعه داده های پذیرش ما شامل داده های جمعیتی کامل نیست. در عوض، عضویت در گروه جمعیتی فقط برای درصد کمی از نمونه‌ها ثبت می‌شود، مانند دانش‌آموزانی که تصمیم گرفتند خود شناسایی کنند که به کدام گروه تعلق دارند. در این مورد، تفکیک مجموعه داوطلبان ما به دانشجویان پذیرفته شده و مردود شده اکنون به صورت زیر است:

یک مجموعه نامزد متشکل از 100 دانش آموز، به دو گروه تقسیم می شود: داوطلبان رد شده (80 نماد دانش آموز) و داوطلبان پذیرفته شده (20 نماد دانشجو). همه نمادها به رنگ خاکستری (به معنی ناشناخته بودن گروه جمعیتی آنها) هستند، به جز 6 نماد. در گروه Rejected، دو نماد دانش آموز به رنگ آبی و دو نماد دانش آموز به رنگ نارنجی سایه می زنند. در گروه Accepted، یک نماد دانش آموز به رنگ آبی و یکی به رنگ نارنجی است.
شکل 5. فهرست نامزدها، با عضویت در گروه جمعیتی تقریباً برای همه نامزدها ناشناخته (نمادها با رنگ خاکستری سایه دار شده اند).

در اینجا ارزیابی پیش‌بینی‌های مدل برای برابری جمعیتی یا برابری فرصت‌ها امکان‌پذیر نیست، زیرا ما برای 94 درصد نمونه‌های خود داده‌های جمعیتی نداریم. با این حال، برای 6 درصد نمونه‌هایی که حاوی ویژگی‌های جمعیت‌شناختی هستند، هنوز می‌توانیم جفت پیش‌بینی‌های فردی را با هم مقایسه کنیم (نامزد اکثریت در مقابل نامزد اقلیت) و ببینیم که آیا مدل به‌طور عادلانه با آنها برخورد کرده است یا خیر.

برای مثال، فرض کنید که داده‌های ویژگی موجود برای دو نامزد (یکی در گروه اکثریت و دیگری در گروه اقلیت، که با ستاره در تصویر زیر مشروح شده است) را به‌طور کامل بررسی کرده‌ایم و مشخص کرده‌ایم که آنها واجد شرایط یکسانی هستند. پذیرش از همه لحاظ اگر مدل پیش‌بینی یکسانی را برای هر دوی این نامزدها انجام دهد (یعنی هر دو نامزد را رد کند یا هر دو نامزد را بپذیرد)، گفته می‌شود که انصاف خلاف واقع را برای این نمونه‌ها برآورده می‌کند. انصاف متضاد تصریح می کند که دو نمونه که از همه جهات یکسان هستند، به جز یک ویژگی حساس معین (در اینجا، عضویت در گروه جمعیتی)، باید به پیش بینی مدل یکسانی منجر شود.

همان ترکیب نامزدهای تصویر قبلی، به جز در این نسخه، یک نماد دانش آموز آبی (متعلق به گروه اکثریت) و یک نماد دانش آموز نارنجی (متعلق به گروه اقلیت) در گروه رد شده با یک ستاره حاشیه نویسی شده است که نشان می دهد این موارد دو نامزد یکسان هستند (به غیر از گروه جمعیتی).
شکل 6. انصاف خلاف واقع برای دو نمونه یکسان (فقط در عضویت در گروه جمعیتی متفاوت است) که با یک ستاره مشروح شده اند، برآورده می شود، زیرا مدل برای هر دو تصمیم یکسان می گیرد (رد شده).

مزایا و معایب

همانطور که قبلا ذکر شد، یکی از مزایای کلیدی انصاف خلاف واقع این است که می توان از آن برای ارزیابی پیش بینی ها برای انصاف در بسیاری از مواردی که استفاده از معیارهای دیگر امکان پذیر نیست استفاده کرد. اگر یک مجموعه داده شامل مجموعه کاملی از مقادیر ویژگی برای ویژگی‌های گروه مربوطه مورد بررسی نباشد، ارزیابی انصاف با استفاده از برابری جمعیتی یا برابری فرصت‌ها ممکن نخواهد بود. با این حال، اگر این ویژگی‌های گروهی برای زیرمجموعه‌ای از نمونه‌ها در دسترس باشند، و امکان شناسایی جفت‌های مشابه از نمونه‌های مشابه در گروه‌های مختلف وجود داشته باشد، پزشکان می‌توانند از عدالت خلاف واقع به عنوان معیاری برای بررسی مدل برای تعصبات احتمالی در پیش‌بینی‌ها استفاده کنند.

علاوه بر این، از آنجایی که معیارهایی مانند برابری جمعیتی و برابری فرصت‌ها گروه‌ها را در مجموع ارزیابی می‌کنند، ممکن است مسائل سوگیری را که بر مدل در سطح پیش‌بینی‌های فردی تأثیر می‌گذارد، پنهان کنند، که می‌تواند با ارزیابی با استفاده از عدالت خلاف واقع آشکار شود. به عنوان مثال، فرض کنید مدل پذیرش ما نامزدهای واجد شرایط را از گروه اکثریت و گروه اقلیت به یک نسبت می پذیرد، اما واجد شرایط ترین نامزد اقلیت رد می شود در حالی که واجد شرایط ترین کاندیدای اکثریت که دقیقاً همان اعتبار را دارد پذیرفته می شود. تجزیه و تحلیل عادلانه خلاف واقع می تواند به شناسایی این نوع اختلافات کمک کند تا بتوان به آنها رسیدگی کرد.

از طرف دیگر، نکته منفی کلیدی انصاف خلاف واقع این است که دیدگاهی جامع از سوگیری در پیش‌بینی‌های مدل ارائه نمی‌کند. شناسایی و اصلاح تعداد انگشت شماری از نابرابری ها در جفت مثال ممکن است برای رسیدگی به مسائل سوگیری سیستمیک که کل زیر گروه های نمونه را تحت تاثیر قرار می دهد کافی نباشد.

در مواردی که ممکن است، پزشکان می‌توانند هم تجزیه و تحلیل عدالت جمعی (با استفاده از معیاری مانند برابری جمعیتی یا برابری فرصت‌ها) و هم تجزیه و تحلیل عادلانه خلاف واقع را برای به دست آوردن گسترده‌ترین طیف بینش در مورد مسائل سوگیری احتمالی که نیاز به اصلاح دارند، در نظر بگیرند.

تمرین: درک خود را بررسی کنید

شکل تمرین. دو گروه از دایره ها: پیش بینی های منفی و پیش بینی های مثبت.              Negative Predictions از 50 دایره تشکیل شده است: 39 دایره خاکستری، 8 دایره آبی و 3 دایره نارنجی. یک دایره آبی با برچسب "A"، یک دایره نارنجی با برچسب "A" و یک دایره آبی با برچسب "C".               پیش بینی های مثبت از 15 دایره تشکیل شده است: 10 دایره خاکستری، 3 دایره آبی و 2 دایره نارنجی. یک دایره آبی با برچسب "B"، یک دایره نارنجی با برچسب "B" و یک دایره آبی با برچسب "C".              افسانه ای در زیر نمودار بیان می کند که دایره های آبی نشان دهنده نمونه ای در گروه اکثریت، دایره های نارنجی نمونه ای در گروه اقلیت، و دایره های خاکستری نمونه هایی را نشان می دهد که عضویت در گروه ناشناخته است.
شکل 7. پیش‌بینی‌های منفی و مثبت برای دسته‌ای از مثال‌ها، با سه جفت مثال با برچسب A، B و C.

در مجموعه پیش‌بینی‌های شکل 7 بالا، کدام یک از جفت‌های مثال‌های یکسان (به استثنای عضویت گروه) زیر پیش‌بینی‌هایی دریافت کردند که انصاف خلاف واقع را نقض می‌کنند؟

جفت A
پیش‌بینی‌های جفت A انصاف خلاف واقع را برآورده می‌کنند، زیرا هم نمونه در گروه اکثریت (آبی) و هم نمونه در گروه اقلیت (نارنجی) یک پیش‌بینی (منفی) را دریافت کردند.
جفت B
پیش‌بینی‌های جفت B انصاف خلاف واقع را برآورده می‌کنند، زیرا هم نمونه در گروه اکثریت (آبی) و هم نمونه در گروه اقلیت (نارنجی) یک پیش‌بینی (مثبت) را دریافت کردند.
جفت C
پیش‌بینی‌های جفت C برای دو مثال است که هر دو به گروه اکثریت (آبی) تعلق دارند. این واقعیت که مدل پیش‌بینی‌های متفاوتی را برای این نمونه‌های یکسان ایجاد کرد، نشان می‌دهد که ممکن است مسائل عملکرد گسترده‌تری در مدل وجود داشته باشد که باید بررسی شود. با این حال، این نتیجه انصاف خلاف واقع را نقض نمی کند، شرایط آن فقط در مواردی اعمال می شود که دو نمونه یکسان هر کدام از گروه های مختلف استخراج شده باشند.
هیچ یک از این جفت ها انصاف خلاف واقع را نقض نمی کنند
پیش‌بینی‌های جفت A و B عدالت خلاف واقع را برآورده می‌کنند زیرا در هر دو مورد، مثال در گروه اکثریت و نمونه در گروه اقلیت، پیش‌بینی یکسانی را دریافت می‌کنند. نمونه های جفت C هر دو متعلق به یک گروه (گروه اکثریت) هستند، بنابراین انصاف خلاف واقع در این مورد قابل اعمال نیست.

خلاصه

برابری جمعیتی ، برابری فرصت ها ، و انصاف خلاف واقع، هر کدام تعاریف ریاضی متفاوتی از انصاف را برای پیش بینی های مدل ارائه می دهند. و اینها فقط سه راه ممکن برای تعیین کمیت انصاف هستند. برخی از تعاریف انصاف حتی با یکدیگر ناسازگار هستند، به این معنی که ممکن است برآورده کردن آنها به طور همزمان برای پیش‌بینی‌های یک مدل معین غیرممکن باشد.

بنابراین چگونه معیار انصاف "درست" را برای مدل خود انتخاب می کنید؟ شما باید زمینه ای که در آن استفاده می شود و اهداف کلی که می خواهید به آن برسید را در نظر بگیرید. به عنوان مثال، آیا هدف دستیابی به بازنمایی برابر است (در این مورد، برابری جمعیتی ممکن است معیار بهینه باشد) یا دستیابی به فرصت برابر (در اینجا، برابری فرصت ممکن است بهترین معیار باشد)؟

برای کسب اطلاعات بیشتر در مورد انصاف ML و بررسی عمیق تر این مسائل، به انصاف و یادگیری ماشینی: محدودیت ها و فرصت ها توسط سولون باروکاس، موریتز هارد و آرویند نارایانان مراجعه کنید.