الإنصاف: تحديد التحيز
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
أثناء إعداد بياناتك لتدريب النموذج وتقييمه، من المهم مراعاة مسائل العدالة والتدقيق في مصادر الانحياز المحتمَلة، حتى تتمكّن من الحدّ من تأثيراتها بشكل استباقي قبل طرح النموذج للاستخدام.
أين يمكن أن يكمن التحيز؟ في ما يلي بعض مؤشرات الخطر التي يجب الانتباه إليها في مجموعة البيانات.
قيم السمات غير متوفّرة
إذا كانت مجموعة البيانات الخاصة بك تحتوي على ميزة واحدة أو أكثر بها قيم مفقودة لعدد كبير من الأمثلة، فقد يكون ذلك مؤشرًا على أن بعض الخصائص الرئيسية لمجموعة البيانات الخاصة بك ممثلة تمثيلاً ناقصًا.
تمرين: التحقّق من فهمك
أنت تقوم بتدريب نموذج للتنبؤ بقابلية إنقاذ الكلاب بناءً على مجموعة
من الميزات، بما في ذلك السلالة والعمر والوزن والمزاج
وكمية سقيفة الفراء كل يوم. هدفك هو التأكد من أن النموذج يؤدي أداءً جيدًا بنفس القدر على جميع أنواع الكلاب، بغض النظر عن سماتها الجسدية أو السلوكية
تكتشف أن 1500 من 5000 مثال في مجموعة التدريب
تفتقد إلى قيم المزاج. أيٌّ مما يلي من مصادر احتمالية
للانحياز يجب التحقيق فيها؟
من المرجّح أن تكون بيانات المزاج غير متوفّرة لسلالات معيّنة من
الكلاب.
إذا كان توفُّر بيانات الحالة المزاجية مرتبطًا بسلالة كلاب،
قد يؤدي ذلك إلى الحصول على توقّعات أقل دقة بشأن قابلية استخدام سلالات معيّنة من الكلاب.
من المرجّح أن تكون بيانات المزاج غير متوفّرة للكلاب التي تقلّ عمرها عن 12
شهرًا.
إذا كان توفّر بيانات المزاج مرتبطًا بالعمر، قد يؤدي ذلك إلى توقعات أقل دقة لقابلية التبني
للكلاب الصغيرة مقارنةً بالكلاب البالغة.
لا تتوفّر بيانات المزاج لجميع الكلاب التي تم إنقاذها من المدن الكبرى.
للوهلة الأولى، قد لا يبدو أنّ هذا مصدر محتمل للانحياز، لأنّ البيانات غير المتوفّرة ستؤثر في جميع الكلاب من المدن الكبيرة بشكل متساوٍ، بغض النظر عن سلالتها وعمرها ووزنها وما إلى ذلك، مع ذلك، ما زلنا بحاجة إلى أن نأخذ في الاعتبار أنّ الموقع الجغرافي الذي ينتمي إليه الكلب
قد يكون خادمًا وكيلاً لهذه الخصائص الجسدية. على سبيل المثال، إذا كان من المرجّح أن تكون الكلاب من المدن الكبيرة
أصغر حجمًا من الكلاب من المناطق الريفية
بشكلٍ أكبر، قد يؤدي ذلك إلى توقّعات أقل دقة بشأن إمكانية تبني الكلاب
ذات الوزن المنخفض أو سلالات الكلاب الصغيرة معيّنة.
بيانات المزاج غير متوفّرة في مجموعة البيانات بشكل عشوائي.
إذا كانت بيانات المزاج غير متوفّرة بشكل عشوائي، لن يكون ذلك
مصدرًا محتملاً للتحيّز. ومع ذلك، من المحتمل أن تظهر بيانات المزاج
مفقودة بشكل عشوائي، ولكن قد يكشف مزيد من التحقيق
عن تفسير لهذا التناقض. لذلك، من المهم
إجراء مراجعة شاملة لاستبعاد الاحتمالات الأخرى، بدلاً من
افتراض أنّ الفجوات في البيانات عشوائية.
قيم العناصر غير المتوقّعة
عند استكشاف البيانات، عليك أيضًا البحث عن أمثلة تحتوي على قيم ميزات
تبرز على أنّها غير نموذجية أو غير عادية بشكل خاص. يمكن أن تشير قيم
السمات غير المتوقّعة هذه إلى مشاكل حدثت أثناء جمع البيانات أو عدم دقة أخرى
قد تؤدي إلى تحيز.
تمرين: التحقق من فهمك
راجِع المجموعة التالية من الأمثلة الافتراضية لتدريب نموذج قابلية تبني الكلاب المنقذة.
السلالة |
العمر (بالسنوات) |
الوزن (رطل) |
المزاج |
shedding_level |
كلب بودل صغير |
2 |
12 |
انفعالي |
منخفضة |
غولدن ريتريفر |
7 |
65 |
ساكن |
مرتفعة |
لابرادور ريتريفر |
35 |
73 |
هادئ |
مرتفعة |
كلب بولدوغ فرنسي |
0.5 |
11 |
هادئ |
متوسط |
سلالة مختلطة غير معروفة |
4 |
45 |
قابلة للاستثارة |
مرتفعة |
كلب صيد باسط |
9 |
48 |
هادئ |
متوسط |
هل يمكنك تحديد أي مشاكل في بيانات العناصر؟
انقر هنا للاطلاع على الإجابة
السلالة |
العمر (بالسنوات) |
الوزن (رطل) |
المزاج |
shedding_level |
كلب بودل صغير |
2 |
12 |
انفعالي |
منخفضة |
غولدن ريتريفر |
7 |
65 |
ساكن |
مرتفعة |
لابرادور ريتريفر |
35 |
73 |
هادئ |
مرتفعة |
كلب بولدوغ فرنسي |
0.5 |
11 |
هادئ |
متوسط |
سلالة مختلطة غير معروفة |
4 |
45 |
قابلة للاستثارة |
مرتفعة |
كلب صيد باسط |
9 |
48 |
هادئ |
متوسط |
إنّ أكبر كلب تم التحقّق من عمره عبر موسوعة غينيس للأرقام القياسية هو Bluey،
وهو كلب من الماشية الأسترالي عاش في الـ 29 عامًا و5 أشهر. وبناءً على ذلك،
يبدو من غير المُرجح أن يبلغ عمر كلب لابرادور ريتريفر 35 عامًا،
والأرجح أنّه تم احتساب عمر الكلب أو تسجيله
بشكل غير دقيق (ربما يبلغ عمر الكلب 3.5 عامًا). يمكن أن يشير هذا الخطأ
أيضًا إلى مشاكل دقة أوسع نطاقًا في بيانات العمر في مجموعة البيانات
تستحق إجراء مزيد من التحقيق.
انحراف البيانات
يمكن أن يؤدي أي نوع من الانحراف في بياناتك، حيث قد تكون مجموعات أو خصائص معينة
ممثلة بشكل ناقص أو زائد بالنسبة إلى انتشارها في العالم الحقيقي،
إلى تحيز في نموذجك.
عند تدقيق أداء النموذج، من المهمّ عدم الاطّلاع على النتائج بشكلٍ إجمالي فقط، بل تقسيم النتائج حسب المجموعة الفرعية. على سبيل المثال، في حالة نموذج قابلية إنقاذ الكلاب، لضمان الإنصاف، لا يكفي
النظر إلى الدقة الشاملة فحسب. يجب أيضًا مراجعة الأداء حسب المجموعة الفرعية
لضمان أداء النموذج بشكلٍ جيد لكل سلالة كلاب ومجموعة عمرية
ومجموعة حجم.
في وقت لاحق من هذه الوحدة، في قسم تقييم الانحياز، سنلقي نظرة عن كثب على الطرق المختلفة لتقييم النماذج حسب المجموعة الفرعية.
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-11-10 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2024-11-10 (حسب التوقيت العالمي المتفَّق عليه)"],[[["\u003cp\u003eTraining data should represent real-world prevalence to avoid bias in machine learning models.\u003c/p\u003e\n"],["\u003cp\u003eMissing or unexpected feature values in the dataset can be indicative of potential sources of bias.\u003c/p\u003e\n"],["\u003cp\u003eData skew, where certain groups are under- or over-represented, can introduce bias and should be addressed.\u003c/p\u003e\n"],["\u003cp\u003eEvaluating model performance by subgroup ensures fairness and equal performance across different characteristics.\u003c/p\u003e\n"],["\u003cp\u003eAuditing for bias requires a thorough review of data and model outcomes to mitigate potential negative impacts.\u003c/p\u003e\n"]]],[],null,["# Fairness: Identifying bias\n\nAs you prepare your data for model training and evaluation, it's important to\nkeep issues of fairness in mind and audit for potential sources of\n[**bias**](/machine-learning/glossary#bias-ethicsfairness), so you can\nproactively mitigate its effects before releasing your model into production.\n\nWhere might bias lurk? Here are some red flags to look out for in your dataset.\n\nMissing feature values\n----------------------\n\nIf your dataset has one or more features that have missing values for a large\nnumber of examples, that could be an indicator that certain key characteristics\nof your dataset are under-represented.\n\n### Exercise: Check your understanding\n\nYou're training a model to predict adoptability of rescue dogs based on a variety of features, including breed, age, weight, temperament, and quantity of fur shed each day. Your goal is to ensure the model performs equally well on all types of dogs, irrespective of their physical or behavioral characteristics \n\n\u003cbr /\u003e\n\nYou discover that 1,500 of the 5,000 examples in the training set are\nmissing temperament values. Which of the following are potential sources\nof bias you should investigate? \nTemperament data is more likely to be missing for certain breeds of dogs. \nIf the availability of temperament data correlates with dog breed, then this might result in less accurate adoptability predictions for certain dog breeds. \nTemperament data is more likely to be missing for dogs under 12 months in age \nIf the availability of temperament data correlates with age, then this might result in less accurate adoptability predictions for puppies versus adult dogs. \nTemperament data is missing for all dogs rescued from big cities. \nAt first glance, it might not appear that this is a potential source of bias, since the missing data would affect all dogs from big cities equally, irrespective of their breed, age, weight, etc. However, we still need to consider that the location a dog is from might effectively serve as a proxy for these physical characteristics. For example, if dogs from big cities are significantly more likely to be smaller than dogs from more rural areas, that could result in less accurate adoptability predictions for lower-weight dogs or certain small-dog breeds. \nTemperament data is missing from the dataset at random. \nIf temperament data is truly missing at random, then that would not be a potential source of bias. However, it's possible temperament data might appear to be missing at random, but further investigation might reveal an explanation for the discrepancy. So it's important to do a thorough review to rule out other possibilities, rather than assume data gaps are random.\n\nUnexpected feature values\n-------------------------\n\nWhen exploring data, you should also look for examples that contain feature values\nthat stand out as especially uncharacteristic or unusual. These unexpected feature\nvalues could indicate problems that occurred during data collection or other\ninaccuracies that could introduce bias.\n\n### Exercise: Check your understanding\n\nReview the following hypothetical set of examples for training a rescue-dog\nadoptability model.\n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nCan you identify any problems with the feature data? \nClick here to see the answer \n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nThe oldest dog to have their age verified by *Guinness World Records*\nwas [Bluey](https://wikipedia.org/wiki/Bluey_(long-lived_dog)),\nan Australian Cattle Dog who lived to be 29 years and 5 months. Given that, it\nseems quite implausible that the labrador retriever is actually 35 years old,\nand more likely that the dog's age was either calculated or recorded\ninaccurately (maybe the dog is actually 3.5 years old). This error could\nalso be indicative of broader accuracy issues with age data in the dataset\nthat merit further investigation.\n\nData skew\n---------\n\nAny sort of skew in your data, where certain groups or characteristics may be\nunder- or over-represented relative to their real-world prevalence, can\nintroduce bias into your model.\n\nWhen auditing model performance, it's important not only to look at results in\naggregate, but to break out results by subgroup. For example, in the case of\nour rescue-dog adoptability model, to ensure fairness, it's not sufficient to\nsimply look at overall accuracy. We should also audit performance by subgroup\nto ensure the model performs equally well for each dog breed, age group, and\nsize group.\n\nLater in this module, in [Evaluating for Bias](/machine-learning/crash-course/fairness/evaluating-for-bias), we'll\ntake a closer look at different methods for evaluating models by subgroup.\n| **Key terms:**\n|\n- [Bias (ethics/fairness)](/machine-learning/glossary#bias-ethicsfairness) \n[Help Center](https://support.google.com/machinelearningeducation)"]]