انصاف: انواع سوگیری

مدل‌های یادگیری ماشین (ML) ذاتاً عینی نیستند. متخصصان ML مدل‌ها را با تغذیه مجموعه‌ای از نمونه‌های آموزشی به آن‌ها آموزش می‌دهند، و مشارکت انسان در تهیه و بررسی این داده‌ها می‌تواند پیش‌بینی‌های یک مدل را مستعد سوگیری کند.

هنگام ساختن مدل‌ها، مهم است که از سوگیری‌های رایج انسانی که می‌توانند در داده‌های شما آشکار شوند آگاه باشید، بنابراین می‌توانید اقدامات پیشگیرانه‌ای برای کاهش اثرات آنها انجام دهید.

سوگیری گزارش

سوگیری تاریخی

تعصب اتوماسیون

سوگیری انتخاب

سوگیری انتخاب زمانی اتفاق می‌افتد که نمونه‌های مجموعه داده به گونه‌ای انتخاب شوند که منعکس کننده توزیع دنیای واقعی آنها نباشد. سوگیری انتخاب می تواند اشکال مختلفی داشته باشد، از جمله سوگیری پوشش، سوگیری بدون پاسخ و سوگیری نمونه گیری.

سوگیری پوشش

سوگیری بدون پاسخ

سوگیری نمونه گیری

سوگیری اسناد گروهی

سوگیری اسناد گروهی تمایلی به تعمیم آنچه در مورد افراد صادق است به کل گروهی است که به آن تعلق دارند. سوگیری اسناد گروهی اغلب به دو شکل زیر ظاهر می شود.

تعصب درون گروهی

سوگیری همگنی خارج از گروه

تعصب ضمنی

سوگیری تایید

تعصب آزمایشگر

تمرین: درک خود را بررسی کنید

کدام یک از انواع سوگیری های زیر می تواند به پیش بینی های نادرست در مدل پذیرش کالج که در مقدمه توضیح داده شد کمک کند؟
سوگیری تاریخی
مدل پذیرش بر اساس سوابق دانشجویی در 20 سال گذشته آموزش داده شد. اگر دانش‌آموزان اقلیت در این داده‌ها نشان داده نمی‌شدند، مدل می‌توانست همان نابرابری‌های تاریخی را هنگام پیش‌بینی داده‌های دانش‌آموزی جدید بازتولید کند.
تعصب درون گروهی
مدل پذیرش توسط دانشجویان فعلی دانشگاه آموزش داده شد، که می‌توانستند ترجیحی ناخودآگاه برای پذیرش دانشجویانی داشته باشند که از پس‌زمینه‌های مشابه خودشان می‌آیند، که می‌تواند بر نحوه مدیریت یا مهندسی ویژگی داده‌هایی که مدل بر اساس آن آموزش داده شده است، تأثیر بگذارد.
سوگیری تایید
مدل پذیرش توسط دانشجویان فعلی دانشگاه آموزش داده شد، که احتمالاً باورهای قبلی در مورد اینکه چه نوع مدارکی با موفقیت در برنامه علوم کامپیوتر مرتبط است، داشتند. آنها می‌توانستند به‌طور ناخواسته داده‌ها را مدیریت کرده یا ویژگی‌ها را مهندسی کنند تا مدل این باورهای موجود را تأیید کند.
تعصب اتوماسیون
تعصب اتوماسیون ممکن است توضیح دهد که چرا کمیته پذیرش استفاده از مدل ML را برای تصمیم گیری در مورد پذیرش انتخاب کرد. آنها ممکن است بر این باور باشند که یک سیستم خودکار نتایج بهتری نسبت به تصمیماتی که توسط انسان ها گرفته می شود، ایجاد می کند. با این حال، سوگیری اتوماسیون هیچ بینشی در مورد اینکه چرا پیش‌بینی‌های مدل در نهایت به انحراف کشیده شد، ارائه نمی‌کند.