Makine öğrenimi modelleri doğası gereği tarafsız değildir. Mühendisler modelleri eğitirken onlara örnek bir veri kümesi sunar. Bu verilerin sağlanması ve seçilmesi, modellerin tahminlerine karşı savunmasız hale gelmesini sağlayabilir.
Model oluştururken, verilerinizi manipüle edebilecek yaygın insan ön yargılarına dikkat etmek önemlidir. Böylece, etkilerini azaltmak için proaktif adımlar atabilirsiniz.
Ön yargı
Raporlama sapması, bir veri kümesinde yakalanan etkinliklerin, mülklerin ve/veya sonuçların sıklığı ile gerçek dünya sıklıklarını doğru şekilde yansıtmadığında ortaya çıkar. Bu sıradanlık, kullanıcıların sıra dışı veya özellikle akılda kalıcı durumları belgelemeye odaklanma eğiliminde oldukları için ortaya çıkabilir.
Otomasyon Taraflı
Otomasyon ön yargısı, otomatik sistemler tarafından ortaya çıkan sonuçları, her birinin hata oranından bağımsız olarak otomatik sistemler tarafından oluşturulan sonuçlar arasında tercih etme eğilimidir.
Seçim Ağırlığı
Seçim ön yargısı, bir veri kümesinin örnekleri gerçek dünyadaki dağılımını yansıtmayacak şekilde seçilirse oluşur. Seçim ön yargısı birçok farklı biçimde olabilir:
Kapsam sapması: Veriler, temsili olarak seçilmemiştir.
Yanıt vermeyen ön yargı (veya katılım ön yargısı): Veriler, veri toplama sürecindeki katılım boşlukları nedeniyle temsili değildir.
Örnekleme sapması: Veri toplama sırasında uygun rastgele hale getirme kullanılmaz.
Grup İlişkilendirme Ön yargısı
Grup ilişkilendirme ön yargısı, bireylerin gerçeklerini ait oldukları bir grubun tamamına genelleştirme eğilimidir. Bu ön yargının iki temel sonucu vardır:
Grup içi önyargı: Üyesi olduğunuz grubun üyelerinin veya aynı zamanda paylaştığınız özelliklerin tercihi.
Grup dışı homojenlik eğilim: Size ait olmayan tek bir grubun üyelerinin stereotip olma veya özelliklerini daha tek tip olarak görme eğilimi.
Üstü kapalı ön yargı
Dolaylı ön yargı, varsayımların kişisel zihin modellerine ve genel deneyimlerine dayalı olmayan kişisel deneyimlerine dayandığında ortaya çıkar.
Yaygın bir örtülü önyargı biçimi, onay ön yargısıdır. Bu modelde model oluşturucular verileri bilinçsiz bir şekilde önceden var olan inançları ve hipotezleri doğrulayan bir şekilde işler. Bazı durumlarda, bir model oluşturucu orijinal hipotezine uygun bir sonuç verene kadar modeli eğitmeye devam edebilir. Buna deneyci ön yargısı denir.