انصاف: انواع تعصب

مدل های یادگیری ماشین ذاتاً عینی نیستند. مهندسان مدل‌ها را با تغذیه مجموعه داده‌هایی از نمونه‌های آموزشی به آن‌ها آموزش می‌دهند و مشارکت انسان در تهیه و تنظیم این داده‌ها می‌تواند پیش‌بینی‌های یک مدل را مستعد سوگیری کند.

هنگام ساختن مدل‌ها، مهم است که از سوگیری‌های رایج انسانی که می‌توانند در داده‌های شما آشکار شوند آگاه باشید، بنابراین می‌توانید اقدامات پیشگیرانه‌ای برای کاهش اثرات آنها انجام دهید.

سوگیری گزارش

سوگیری گزارش‌دهی زمانی اتفاق می‌افتد که فراوانی رویدادها، ویژگی‌ها و/یا نتایج ثبت‌شده در یک مجموعه داده به‌طور دقیق فرکانس دنیای واقعی آن‌ها را منعکس نمی‌کند. این سوگیری می تواند به این دلیل ایجاد شود که افراد تمایل دارند بر مستندسازی شرایطی تمرکز کنند که غیرعادی یا به خصوص به یاد ماندنی هستند، با این فرض که شرایط عادی می تواند "بی خبر باشد".

تعصب اتوماسیون

سوگیری اتوماسیون تمایل به برتری دادن به نتایج تولید شده توسط سیستم های خودکار نسبت به نتایج تولید شده توسط سیستم های غیر خودکار، صرف نظر از میزان خطای هر کدام است.

تعصب انتخاب

سوگیری انتخاب زمانی رخ می دهد که نمونه های مجموعه داده به گونه ای انتخاب شوند که منعکس کننده توزیع دنیای واقعی آنها نباشد. سوگیری انتخاب می تواند اشکال مختلفی داشته باشد:

  • سوگیری پوشش : داده ها به صورت نماینده انتخاب نشده اند.
  • سوگیری بدون پاسخ (یا سوگیری مشارکت ): داده‌ها به دلیل شکاف‌های مشارکت در فرآیند جمع‌آوری داده‌ها، به‌عنوان غیرنماینده می‌شوند.
  • سوگیری نمونه گیری : در طول جمع آوری داده ها از تصادفی سازی مناسب استفاده نمی شود.

سوگیری اسناد گروهی

سوگیری اسناد گروهی تمایل به تعمیم آنچه در مورد افراد صادق است به کل گروهی است که به آن تعلق دارند. دو نشانه اصلی این تعصب عبارتند از:

  • تعصب درون گروهی : ترجیحی برای اعضای گروهی که شما نیز به آن تعلق دارید ، یا برای ویژگی هایی که شما نیز به اشتراک می گذارید.
  • سوگیری همگنی بیرون گروهی : تمایل به کلیشه سازی اعضای گروهی که به آن تعلق ندارید ، یا اینکه ویژگی های آنها را یکنواخت تر ببینید.

تعصب ضمنی

سوگیری ضمنی زمانی اتفاق می‌افتد که مفروضاتی بر اساس مدل‌های ذهنی و تجربیات شخصی شخص ساخته می‌شوند که لزوماً کاربرد کلی‌تری ندارند.

یک شکل رایج سوگیری ضمنی، سوگیری تایید است، که در آن سازندگان مدل ناخودآگاه داده‌ها را به روش‌هایی پردازش می‌کنند که باورها و فرضیه‌های از پیش موجود را تایید می‌کنند. در برخی موارد، یک سازنده مدل ممکن است واقعاً به آموزش یک مدل ادامه دهد تا زمانی که نتیجه ای ایجاد کند که با فرضیه اصلی آنها همسو باشد. به این تعصب آزمایشگر می گویند .