مدل های یادگیری ماشین ذاتاً عینی نیستند. مهندسان مدلها را با تغذیه مجموعه دادههایی از نمونههای آموزشی به آنها آموزش میدهند و مشارکت انسان در تهیه و تنظیم این دادهها میتواند پیشبینیهای یک مدل را مستعد سوگیری کند.
هنگام ساختن مدلها، مهم است که از سوگیریهای رایج انسانی که میتوانند در دادههای شما آشکار شوند آگاه باشید، بنابراین میتوانید اقدامات پیشگیرانهای برای کاهش اثرات آنها انجام دهید.
سوگیری گزارش
سوگیری گزارشدهی زمانی اتفاق میافتد که فراوانی رویدادها، ویژگیها و/یا نتایج ثبتشده در یک مجموعه داده بهطور دقیق فرکانس دنیای واقعی آنها را منعکس نمیکند. این سوگیری می تواند به این دلیل ایجاد شود که افراد تمایل دارند بر مستندسازی شرایطی تمرکز کنند که غیرعادی یا به خصوص به یاد ماندنی هستند، با این فرض که شرایط عادی می تواند "بی خبر باشد".
تعصب اتوماسیون
سوگیری اتوماسیون تمایل به برتری دادن به نتایج تولید شده توسط سیستم های خودکار نسبت به نتایج تولید شده توسط سیستم های غیر خودکار، صرف نظر از میزان خطای هر کدام است.
تعصب انتخاب
سوگیری انتخاب زمانی رخ می دهد که نمونه های مجموعه داده به گونه ای انتخاب شوند که منعکس کننده توزیع دنیای واقعی آنها نباشد. سوگیری انتخاب می تواند اشکال مختلفی داشته باشد:
سوگیری پوشش : داده ها به صورت نماینده انتخاب نشده اند.
سوگیری بدون پاسخ (یا سوگیری مشارکت ): دادهها به دلیل شکافهای مشارکت در فرآیند جمعآوری دادهها، بهعنوان غیرنماینده میشوند.
سوگیری نمونه گیری : در طول جمع آوری داده ها از تصادفی سازی مناسب استفاده نمی شود.
سوگیری اسناد گروهی
سوگیری اسناد گروهی تمایل به تعمیم آنچه در مورد افراد صادق است به کل گروهی است که به آن تعلق دارند. دو نشانه اصلی این تعصب عبارتند از:
تعصب درون گروهی : ترجیحی برای اعضای گروهی که شما نیز به آن تعلق دارید ، یا برای ویژگی هایی که شما نیز به اشتراک می گذارید.
سوگیری همگنی بیرون گروهی : تمایل به کلیشه سازی اعضای گروهی که به آن تعلق ندارید ، یا اینکه ویژگی های آنها را یکنواخت تر ببینید.
تعصب ضمنی
سوگیری ضمنی زمانی اتفاق میافتد که مفروضاتی بر اساس مدلهای ذهنی و تجربیات شخصی شخص ساخته میشوند که لزوماً کاربرد کلیتری ندارند.
یک شکل رایج سوگیری ضمنی، سوگیری تایید است، که در آن سازندگان مدل ناخودآگاه دادهها را به روشهایی پردازش میکنند که باورها و فرضیههای از پیش موجود را تایید میکنند. در برخی موارد، یک سازنده مدل ممکن است واقعاً به آموزش یک مدل ادامه دهد تا زمانی که نتیجه ای ایجاد کند که با فرضیه اصلی آنها همسو باشد. به این تعصب آزمایشگر می گویند .