انصاف: شناسایی سوگیری
با مجموعهها، منظم بمانید
ذخیره و طبقهبندی محتوا براساس اولویتهای شما.
همانطور که دادههای خود را برای آموزش و ارزیابی مدل آماده میکنید، مهم است که مسائل مربوط به انصاف و ممیزی منابع بالقوه سوگیری را در نظر داشته باشید، بنابراین میتوانید پیش از عرضه مدل خود به تولید، اثرات آن را به طور فعال کاهش دهید.
تعصب کجا ممکن است در کمین باشد؟ در اینجا چند پرچم قرمز وجود دارد که باید در مجموعه داده خود به آنها توجه کنید.
مقادیر ویژگی از دست رفته است
اگر مجموعه داده شما دارای یک یا چند ویژگی است که مقادیر زیادی از نمونهها را ندارند، این میتواند نشاندهنده این باشد که برخی از ویژگیهای کلیدی مجموعه داده شما کمتر نشان داده شدهاند.
تمرین: درک خود را بررسی کنید
شما در حال آموزش مدلی برای پیشبینی پذیرش سگهای نجات هستید که بر اساس ویژگیهای مختلف، از جمله نژاد، سن، وزن، خلق و خو، و مقدار خز ریخته شده در هر روز میباشد. هدف شما این است که اطمینان حاصل کنید که این مدل در تمام انواع سگها، صرف نظر از ویژگیهای فیزیکی یا رفتاری آنها، به یک اندازه خوب عمل میکند.
متوجه میشوید که 1500 مورد از 5000 نمونه در مجموعه آموزشی فاقد ارزشهای خلقی هستند. کدام یک از موارد زیر منابع بالقوه سوگیری هستند که باید بررسی کنید؟
اطلاعات مربوط به خلق و خوی احتمال بیشتری وجود دارد که برای نژادهای خاصی از سگ ها ناپدید شوند.
اگر در دسترس بودن دادههای خلق و خوی با نژاد سگ مرتبط باشد، این ممکن است منجر به پیشبینیهای سازگاری کمتر دقیقتر برای نژادهای خاص سگ شود.
اطلاعات مربوط به مزاج سگهای زیر 12 ماه بیشتر از بین میرود
اگر در دسترس بودن دادههای خلق و خوی با سن مرتبط باشد، این ممکن است منجر به پیشبینیهای سازگاری با دقت کمتری برای تولهها در مقایسه با سگهای بالغ شود.
داده های خلق و خوی برای همه سگ هایی که از شهرهای بزرگ نجات داده شده اند وجود ندارد.
در نگاه اول، ممکن است به نظر نرسد که این یک منبع بالقوه سوگیری است، زیرا داده های از دست رفته بر همه سگ های شهرهای بزرگ، صرف نظر از نژاد، سن، وزن و غیره به طور یکسان تأثیر می گذارد. با این حال، ما هنوز باید در نظر بگیریم که مکانی که سگ در آن قرار دارد ممکن است به طور موثری به عنوان نماینده ای برای این ویژگی های فیزیکی عمل کند. برای مثال، اگر سگهای شهرهای بزرگ بهطور قابل توجهی کوچکتر از سگهای مناطق روستاییتر باشند، این میتواند منجر به پیشبینیهای نادرست پذیرش برای سگهای کموزن یا برخی از نژادهای سگهای کوچک شود.
داده های خلق و خوی به طور تصادفی در مجموعه داده وجود ندارد.
اگر دادههای خلق و خوی واقعاً بهطور تصادفی از دست رفته باشد، این منبع بالقوه سوگیری نخواهد بود. با این حال، این احتمال وجود دارد که دادههای خلق و خوی به طور تصادفی گم شده باشند، اما تحقیقات بیشتر ممکن است توضیحی را برای این اختلاف نشان دهد. بنابراین مهم است که یک بررسی کامل برای رد احتمالات دیگر انجام دهید، نه اینکه شکاف داده ها را تصادفی فرض کنید.
مقادیر ویژگی غیرمنتظره
هنگام کاوش دادهها، باید به دنبال نمونههایی باشید که حاوی مقادیر مشخصهای هستند که بهویژه غیرمعمول یا غیرعادی هستند. این مقادیر ویژگی غیرمنتظره میتواند مشکلاتی را نشان دهد که در طول جمعآوری دادهها یا سایر نادرستیهایی که میتوانند سوگیری ایجاد کنند، رخ داده است.
تمرین: درک خود را بررسی کنید
مجموعه مثالهای فرضی زیر را برای آموزش مدل پذیرش سگ نجاتی مرور کنید.
نژاد | سن (سال) | وزن (پوند) | خلق و خوی | shedding_level |
---|
پودل اسباب بازی | 2 | 12 | تحریک پذیر | پایین |
گلدن رتریور | 7 | 65 | آرام | بالا |
لابرادور رتریور | 35 | 73 | آرام | بالا |
بولداگ فرانسوی | 0.5 | 11 | آرام | متوسط |
نژاد مخلوط ناشناخته | 4 | 45 | تحریک پذیر | بالا |
سگ شکاری | 9 | 48 | آرام | متوسط |
آیا می توانید مشکلات مربوط به داده های ویژگی را شناسایی کنید؟
برای مشاهده پاسخ اینجا را کلیک کنید
نژاد | سن (سال) | وزن (پوند) | خلق و خوی | shedding_level |
---|
پودل اسباب بازی | 2 | 12 | تحریک پذیر | پایین |
گلدن رتریور | 7 | 65 | آرام | بالا |
لابرادور رتریور | 35 | 73 | آرام | بالا |
بولداگ فرانسوی | 0.5 | 11 | آرام | متوسط |
نژاد مخلوط ناشناخته | 4 | 45 | تحریک پذیر | بالا |
سگ شکاری | 9 | 48 | آرام | متوسط |
مسن ترین سگی که سنش توسط رکوردهای جهانی گینس تایید شد، Bluey ، سگ گاو استرالیایی بود که 29 سال و 5 ماه عمر کرد. با توجه به آن، به نظر می رسد کاملا غیر قابل قبول است که لابرادور رتریور در واقع 35 سال سن داشته باشد، و به احتمال زیاد سن سگ یا محاسبه شده یا به اشتباه ثبت شده است (شاید سگ در واقع 3.5 سال داشته باشد). این خطا همچنین میتواند نشاندهنده مسائل مربوط به دقت گستردهتر با دادههای سن در مجموعه داده باشد که مستلزم بررسی بیشتر است.
انحراف داده ها
هر نوع انحراف در دادههای شما، که در آن گروهها یا ویژگیهای خاصی ممکن است نسبت به شیوع آنها در دنیای واقعی کمتر یا بیش از حد نشان داده شوند، میتواند سوگیری را در مدل شما ایجاد کند.
هنگام ممیزی عملکرد مدل، نه تنها نگاه کردن به نتایج در مجموع، بلکه تجزیه نتایج بر اساس زیرگروه مهم است. به عنوان مثال، در مورد مدل پذیرش سگ نجات ما، برای اطمینان از انصاف، صرفاً نگاه کردن به دقت کلی کافی نیست. ما همچنین باید عملکرد را بر اساس زیر گروه بررسی کنیم تا مطمئن شویم که مدل برای هر نژاد، گروه سنی و گروه اندازه سگ به یک اندازه خوب عمل می کند.
بعداً در این ماژول، در Evaluating for Bias ، نگاهی دقیقتر به روشهای مختلف برای ارزیابی مدلها بر اساس زیرگروه خواهیم داشت.
جز در مواردی که غیر از این ذکر شده باشد،محتوای این صفحه تحت مجوز Creative Commons Attribution 4.0 License است. نمونه کدها نیز دارای مجوز Apache 2.0 License است. برای اطلاع از جزئیات، به خطمشیهای سایت Google Developers مراجعه کنید. جاوا علامت تجاری ثبتشده Oracle و/یا شرکتهای وابسته به آن است.
تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-10-31 بهوقت ساعت هماهنگ جهانی."],[[["\u003cp\u003eTraining data should represent real-world prevalence to avoid bias in machine learning models.\u003c/p\u003e\n"],["\u003cp\u003eMissing or unexpected feature values in the dataset can be indicative of potential sources of bias.\u003c/p\u003e\n"],["\u003cp\u003eData skew, where certain groups are under- or over-represented, can introduce bias and should be addressed.\u003c/p\u003e\n"],["\u003cp\u003eEvaluating model performance by subgroup ensures fairness and equal performance across different characteristics.\u003c/p\u003e\n"],["\u003cp\u003eAuditing for bias requires a thorough review of data and model outcomes to mitigate potential negative impacts.\u003c/p\u003e\n"]]],[],null,["# Fairness: Identifying bias\n\nAs you prepare your data for model training and evaluation, it's important to\nkeep issues of fairness in mind and audit for potential sources of\n[**bias**](/machine-learning/glossary#bias-ethicsfairness), so you can\nproactively mitigate its effects before releasing your model into production.\n\nWhere might bias lurk? Here are some red flags to look out for in your dataset.\n\nMissing feature values\n----------------------\n\nIf your dataset has one or more features that have missing values for a large\nnumber of examples, that could be an indicator that certain key characteristics\nof your dataset are under-represented.\n\n### Exercise: Check your understanding\n\nYou're training a model to predict adoptability of rescue dogs based on a variety of features, including breed, age, weight, temperament, and quantity of fur shed each day. Your goal is to ensure the model performs equally well on all types of dogs, irrespective of their physical or behavioral characteristics \n\n\u003cbr /\u003e\n\nYou discover that 1,500 of the 5,000 examples in the training set are\nmissing temperament values. Which of the following are potential sources\nof bias you should investigate? \nTemperament data is more likely to be missing for certain breeds of dogs. \nIf the availability of temperament data correlates with dog breed, then this might result in less accurate adoptability predictions for certain dog breeds. \nTemperament data is more likely to be missing for dogs under 12 months in age \nIf the availability of temperament data correlates with age, then this might result in less accurate adoptability predictions for puppies versus adult dogs. \nTemperament data is missing for all dogs rescued from big cities. \nAt first glance, it might not appear that this is a potential source of bias, since the missing data would affect all dogs from big cities equally, irrespective of their breed, age, weight, etc. However, we still need to consider that the location a dog is from might effectively serve as a proxy for these physical characteristics. For example, if dogs from big cities are significantly more likely to be smaller than dogs from more rural areas, that could result in less accurate adoptability predictions for lower-weight dogs or certain small-dog breeds. \nTemperament data is missing from the dataset at random. \nIf temperament data is truly missing at random, then that would not be a potential source of bias. However, it's possible temperament data might appear to be missing at random, but further investigation might reveal an explanation for the discrepancy. So it's important to do a thorough review to rule out other possibilities, rather than assume data gaps are random.\n\nUnexpected feature values\n-------------------------\n\nWhen exploring data, you should also look for examples that contain feature values\nthat stand out as especially uncharacteristic or unusual. These unexpected feature\nvalues could indicate problems that occurred during data collection or other\ninaccuracies that could introduce bias.\n\n### Exercise: Check your understanding\n\nReview the following hypothetical set of examples for training a rescue-dog\nadoptability model.\n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nCan you identify any problems with the feature data? \nClick here to see the answer \n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nThe oldest dog to have their age verified by *Guinness World Records*\nwas [Bluey](https://wikipedia.org/wiki/Bluey_(long-lived_dog)),\nan Australian Cattle Dog who lived to be 29 years and 5 months. Given that, it\nseems quite implausible that the labrador retriever is actually 35 years old,\nand more likely that the dog's age was either calculated or recorded\ninaccurately (maybe the dog is actually 3.5 years old). This error could\nalso be indicative of broader accuracy issues with age data in the dataset\nthat merit further investigation.\n\nData skew\n---------\n\nAny sort of skew in your data, where certain groups or characteristics may be\nunder- or over-represented relative to their real-world prevalence, can\nintroduce bias into your model.\n\nWhen auditing model performance, it's important not only to look at results in\naggregate, but to break out results by subgroup. For example, in the case of\nour rescue-dog adoptability model, to ensure fairness, it's not sufficient to\nsimply look at overall accuracy. We should also audit performance by subgroup\nto ensure the model performs equally well for each dog breed, age group, and\nsize group.\n\nLater in this module, in [Evaluating for Bias](/machine-learning/crash-course/fairness/evaluating-for-bias), we'll\ntake a closer look at different methods for evaluating models by subgroup.\n| **Key terms:**\n|\n- [Bias (ethics/fairness)](/machine-learning/glossary#bias-ethicsfairness) \n[Help Center](https://support.google.com/machinelearningeducation)"]]