انصاف: کاهش تعصب
با مجموعهها، منظم بمانید
ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
هنگامی که منبع سوگیری در داده های آموزشی شناسایی شد، می توانیم اقدامات پیشگیرانه ای برای کاهش اثرات آن انجام دهیم. دو استراتژی اصلی وجود دارد که مهندسان یادگیری ماشین (ML) معمولاً برای اصلاح سوگیری استفاده میکنند:
- افزایش داده های آموزشی
- تنظیم عملکرد از دست دادن مدل.
افزایش داده های آموزشی
اگر ممیزی دادههای آموزشی مشکلاتی را در مورد دادههای گمشده، نادرست یا منحرف نشان دهد، سادهترین راه برای رسیدگی به مشکل اغلب جمعآوری دادههای اضافی است.
با این حال، در حالی که افزایش دادههای آموزشی میتواند ایدهآل باشد، اما جنبه منفی این رویکرد این است که میتواند غیرقابل اجرا باشد، یا به دلیل کمبود دادههای موجود یا محدودیتهای منابع که مانع از جمعآوری دادهها میشود. به عنوان مثال، جمع آوری داده های بیشتر ممکن است بسیار پرهزینه یا وقت گیر باشد، یا به دلیل محدودیت های قانونی/حریم خصوصی قابل اجرا نباشد.
تنظیم تابع بهینه سازی مدل
در مواردی که جمعآوری دادههای آموزشی اضافی امکانپذیر نیست، رویکرد دیگر برای کاهش تعصب، تنظیم نحوه محاسبه ضرر در طول آموزش مدل است. ما معمولاً از یک تابع بهینه سازی مانند از دست دادن گزارش برای جریمه کردن پیش بینی های مدل نادرست استفاده می کنیم. با این حال، از دست دادن گزارش، عضویت در زیر گروه را در نظر نمی گیرد. بنابراین به جای استفاده از از دست دادن گزارش، میتوانیم یک تابع بهینهسازی را انتخاب کنیم که برای جریمه کردن خطاها به شیوهای عادلانه طراحی شده است که با عدم تعادلی که در دادههای آموزشی خود شناسایی کردهایم مقابله میکند.
کتابخانه اصلاح مدل TensorFlow ابزارهایی را برای به کارگیری دو تکنیک مختلف کاهش تعصب در طول آموزش مدل ارائه می دهد:
MinDiff : هدف MinDiff متعادل کردن خطاها برای دو بخش مختلف از داده ها (دانش آموزان پسر/زن در مقابل دانش آموزان غیر باینری) با اضافه کردن یک جریمه برای تفاوت در توزیع های پیش بینی برای دو گروه است.
جفتسازی لاجیت متضاد : هدف جفتسازی لاجیت متضاد (CLP) این است که اطمینان حاصل شود که تغییر ویژگی حساس یک مثال، پیشبینی مدل را برای آن مثال تغییر نمیدهد. به عنوان مثال، اگر یک مجموعه داده آموزشی شامل دو مثال باشد که مقادیر ویژگیهای آنها یکسان است، به جز اینکه یکی دارای ارزش gender
male
و دیگری دارای ارزش gender
nonbinary
باشد، اگر پیشبینیهای این دو مثال متفاوت باشد، CLP یک جریمه اضافه میکند.
تکنیک هایی که برای تنظیم تابع بهینه سازی انتخاب می کنید به موارد استفاده مدل بستگی دارد. در بخش بعدی، با در نظر گرفتن این موارد استفاده، نگاه دقیقتری به چگونگی نزدیک شدن به کار ارزیابی یک مدل برای انصاف خواهیم داشت.
تمرین: درک خود را بررسی کنید
کدام یک از عبارات زیر در مورد تکنیکهای کاهش تعصب درست است؟
MinDiff و CLP هر دو اختلاف در عملکرد مدل مرتبط با ویژگی های حساس را جریمه می کنند
هدف هر دو تکنیک کاهش تعصب با جریمه کردن خطاهای پیشبینی ناشی از عدم تعادل در نحوه نمایش ویژگیهای حساس در دادههای آموزشی است.
MinDiff تفاوتها در توزیع کلی پیشبینیها را برای برشهای مختلف داده جریمه میکند، در حالی که CLP مغایرتها در پیشبینیها را برای جفت مثالهای جداگانه جریمه میکند.
MinDiff با تراز کردن توزیع امتیاز برای دو زیر گروه به تعصب می پردازد. CLP با حصول اطمینان از اینکه نمونههای منفرد صرفاً به دلیل عضویت در زیرگروهها متفاوت رفتار نمیشوند، با سوگیری مقابله میکند.
افزودن نمونه های بیشتر به مجموعه داده آموزشی همیشه به مقابله با سوگیری در پیش بینی های یک مدل کمک می کند.
افزودن نمونههای آموزشی بیشتر یک استراتژی مؤثر برای کاهش تعصب است، اما ترکیب دادههای آموزشی جدید مهم است. اگر نمونههای آموزشی اضافی، عدم تعادل مشابه با دادههای اصلی را نشان دهند، احتمالاً به کاهش تعصب موجود کمکی نخواهند کرد.
اگر با افزودن دادههای آموزشی بیشتر، سوگیری را کاهش میدهید، نباید در طول تمرین از MinDiff یا CLP استفاده کنید.
افزایش داده های آموزشی و استفاده از تکنیک هایی مانند MinDiff یا CLP می توانند مکمل یکدیگر باشند. به عنوان مثال، یک مهندس ML ممکن است بتواند داده های آموزشی اضافی کافی را جمع آوری کند تا اختلاف عملکرد را تا 30٪ کاهش دهد و سپس از MinDiff برای کاهش بیشتر اختلاف تا 50٪ دیگر استفاده کند.
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eMachine learning engineers use two primary strategies to mitigate bias in models: augmenting training data and adjusting the model's loss function.\u003c/p\u003e\n"],["\u003cp\u003eAugmenting training data involves collecting additional data to address missing, incorrect, or skewed data, but it can be infeasible due to data availability or resource constraints.\u003c/p\u003e\n"],["\u003cp\u003eAdjusting the model's loss function involves using fairness-aware optimization functions like MinDiff or Counterfactual Logit Pairing to penalize errors based on sensitive attributes and counteract imbalances in training data.\u003c/p\u003e\n"],["\u003cp\u003eMinDiff aims to balance errors between different data slices by penalizing differences in prediction distributions, while Counterfactual Logit Pairing penalizes discrepancies in predictions for similar examples with different sensitive attribute values.\u003c/p\u003e\n"],["\u003cp\u003eChoosing the right bias-mitigation technique depends on the specific use case of the model, and augmenting training data and adjusting the loss function can be used in conjunction for optimal bias reduction.\u003c/p\u003e\n"]]],[],null,["# Fairness: Mitigating bias\n\nOnce a source of [**bias**](/machine-learning/glossary#bias-ethicsfairness)\nhas been identified in the training data, we can take proactive steps to\nmitigate its effects. There are two main strategies that machine learning (ML)\nengineers typically employ to remediate bias:\n\n- Augmenting the training data.\n- Adjusting the model's loss function.\n\nAugmenting the training data\n----------------------------\n\nIf an audit of the training data has uncovered issues with missing, incorrect,\nor skewed data, the most straightforward way to address the problem is often\nto collect additional data.\n\nHowever, while augmenting the training data can be ideal, the downside of\nthis approach is that it can also be infeasible, either due to a lack of\navailable data or resource constraints that impede data collection. For example,\ngathering more data might be too costly or time-consuming, or not viable due to\nlegal/privacy restrictions.\n\nAdjusting the model's optimization function\n-------------------------------------------\n\nIn cases where collecting additional training data is not viable, another\napproach for mitigating bias is to adjust how loss is calculated during model\ntraining. We typically use an optimization function like\n[**log loss**](/machine-learning/glossary#log-loss) to penalize incorrect model\npredictions. However, log loss does not take subgroup membership into\nconsideration. So instead of using log loss, we can choose an optimization\nfunction designed to penalize errors in a fairness-aware fashion that\ncounteracts the imbalances we've identified in our training data.\n\nThe TensorFlow Model Remediation Library provides utilities for applying two\ndifferent bias-mitigation techniques during model training:\n\n- [**MinDiff**](https://www.tensorflow.org/responsible_ai/model_remediation/min_diff/guide/mindiff_overview):\n MinDiff aims to balance the errors for two different slices of data\n (male/female students versus nonbinary students) by adding a penalty for\n differences in the prediction distributions for the two groups.\n\n- [**Counterfactual Logit Pairing**](https://www.tensorflow.org/responsible_ai/model_remediation/counterfactual/guide/counterfactual_overview):\n Counterfactual Logit Pairing (CLP) aims to ensure that changing a sensitive\n attribute of a given example doesn't alter the model's prediction for that\n example. For example, if a training dataset contains two examples whose\n feature values are identical, except one has a `gender` value of `male` and\n the other has a `gender` value of `nonbinary`, CLP will add a penalty if\n the predictions for these two examples are different.\n\nThe techniques you choose for adjusting the optimization function are\ndependent on the use cases for the model. In the next section, we'll take a\ncloser look at how to approach the task of evaluating a model for fairness\nby considering these use cases.\n\n### Exercise: Check your understanding\n\nWhich of the following statements regarding bias-mitigation techniques are true? \nBoth MinDiff and CLP penalize discrepancies in model performance tied to sensitive attributes \nBoth techniques aim to mitigate bias by penalizing prediction errors resulting from imbalances in how sensitive attributes are represented in training data. \nMinDiff penalizes differences in the overall distribution of predictions for different slices of data, whereas CLP penalizes discrepancies in predictions for individual pairs of examples. \nMinDiff addresses bias by aligning score distributions for two subgroups. CLP tackles bias by ensuring that individual examples are not treated differently solely because of their subgroup membership. \nAdding more examples to the training dataset will always help counteract bias in a model's predictions. \nAdding more training examples is an effective strategy for mitigating bias, but the composition of the new training data matters. If the additional training examples exhibit similar imbalances to the original data, they probably won't help mitigate the existing bias. \nIf you are mitigating bias by adding more training data, you shouldn't also apply MinDiff or CLP during training. \nAugmenting training data and applying techniques like MinDiff or CLP can be complementary. For example, an ML engineer might be able to collect enough additional training data to reduce a discrepancy in performance by 30%, and then use MinDiff to further reduce the discrepancy by another 50%.\n| **Key terms:**\n|\n| - [Bias (ethics/fairness)](/machine-learning/glossary#bias-ethicsfairness)\n- [Log Loss](/machine-learning/glossary#log-loss) \n[Help Center](https://support.google.com/machinelearningeducation)"]]