Makine öğrenimi (ML) modelleri doğası gereği objektif değildir. Makine öğrenimi uygulayıcıları, eğitim örneklerinden oluşan bir veri kümesi besleyerek modelleri eğitir. Bu verilerin sağlanması ve seçimine insanların dahil olması, bir modelin tahminlerini yanlılığa açık hale getirebilir.
Model oluştururken verilerinizdeki yaygın insan yanlılıklarının farkında olmanız önemlidir. Böylece, etkilerini azaltmak için proaktif adımlar atabilirsiniz.
Raporlama yanlılığı
-
Tanım
Raporlama önyargısı, bir veri kümesinde yakalanan etkinliklerin, özelliklerin ve/veya sonuçların sıklığı, bunların gerçek hayattaki sıklığını doğru şekilde yansıtmadığında ortaya çıkar. Bu önyargının ortaya çıkma nedeni, sıradan durumların kaydedilmesine gerek olmadığı varsayılarak insanların alışılmadık veya özellikle akılda kalan durumları kaydetme eğiliminde olmasıdır.
-
Örnek
Bir duygu analizi modeli, popüler bir web sitesine gönderilen kullanıcı girişlerinden oluşan bir veri kümesine göre kitap yorumlarının olumlu mu yoksa olumsuz mu olduğunu tahmin etmek için eğitilir. Eğitim veri kümesindeki yorumların çoğu, aşırı görüşleri (bir kitabı seven veya kitaptan nefret eden eleştirmenler) yansıtır. Bunun nedeni, kullanıcıların bir kitapla ilgili sert bir yanıt vermedikleri takdirde yorum gönderme olasılıklarının daha düşük olmasıdır. Sonuç olarak, model bir kitabı tanımlamak için daha incelikli bir dil kullanan yorumların duygusunu doğru şekilde tahmin etmekte daha az başarılıdır.
Tanım için chevron_left öğesini tıklayın.
Tarihsel önyargı
-
Tanım
Geçmiş önyargısı, geçmiş veriler o dönemde dünyadaki eşitsizlikleri yansıttığında ortaya çıkar.
-
Örnek
1960'lara ait bir şehir konut veri kümesi, söz konusu on yıl içinde geçerli olan ayrımcı kredi verme uygulamalarını yansıtan ev fiyatlarını içerir.
Tanım için chevron_left öğesini tıklayın.
Otomasyon yanlılığı
-
Tanım
Otomasyon önyargısı, hata oranlarına bakmadan, otomatik sistemler tarafından üretilen sonuçların otomatik olmayan sistemler tarafından üretilenlere tercih edilmesidir.
-
Örnek
Bir zincir dişli üreticisi için çalışan makine öğrenimi uzmanları, diş kusurlarını tespit etmek üzere eğittikleri yeni "çığır açan" modeli kullanıma sunmak için sabırsızlanıyordu. Ancak fabrika yöneticisi, modelin hem doğruluk hem de yeniden bulma oranlarının gerçek denetleyicilerin oranlarından% 15 daha düşük olduğunu fark etti.
Tanımı görmek için chevron_left simgesini tıklayın.
Seçim yanlılığı
Seçim önyargısı, bir veri kümesindeki örneklerin gerçek dünyadaki dağılımı yansıtmayacak biçimde seçilmesiyle ortaya çıkar. Seçim yanlılığı; kapsam yanlılığı, yanıt vermeme yanlılığı ve örnekleme yanlılığı dahil olmak üzere birçok farklı biçimde olabilir.
Kapsam yanlılığı
-
Tanım
Kapsam önyargısı, veriler temsili bir şekilde seçilmediğinde ortaya çıkar.
-
Örnek
Bir model, ürünü satın alan tüketicilerden oluşan bir örnekle yapılan telefon anketlerine göre yeni bir ürünün gelecekteki satışlarını tahmin edecek şekilde eğitilir. Bunun yerine rakip bir ürünü satın almayı tercih eden tüketicilere anket uygulanmadı ve bu nedenle bu kullanıcı grubu eğitim verilerinde temsil edilmedi.
Tanım için chevron_left öğesini tıklayın.
Yanıt vermeme yanlılığı
-
Tanım
Yanıtsızlık önyargısı (katılım önyargısı olarak da bilinir), veri toplama sürecindeki katılım eksiklikleri nedeniyle verinin temsili olmama durumunda ortaya çıkar.
-
Örnek
Bir model, ürünü satın alan tüketicilerden ve rakip bir ürünü satın alan tüketicilerden oluşan bir örnekle yapılan telefon anketlerine göre yeni bir ürünün gelecekteki satışlarını tahmin edecek şekilde eğitilir. Rakip ürünü satın alan tüketicilerin anketi doldurmayı reddetme olasılığı% 80 daha yüksekti ve bu tüketicilerin verileri örnekte yeterince temsil edilmiyordu.
Tanım için chevron_left öğesini tıklayın.
Örnekleme yanlılığı
-
Tanım
Veri toplama sırasında uygun rastgele hale getirme kullanılmazsa örnekleme yanlılığı ortaya çıkar.
-
Örnek
Bir model, ürünü satın alan tüketicilerden ve rakip bir ürünü satın alan tüketicilerden oluşan bir örnekle yapılan telefon anketlerine göre yeni bir ürünün gelecekteki satışlarını tahmin edecek şekilde eğitilir. Anket uzmanı, tüketicileri rastgele hedeflemek yerine, bir e-postaya yanıt veren ilk 200 tüketiciyi seçti. Bu tüketiciler, ürün hakkında ortalama satın alma işlemi gerçekleştiren tüketicilere kıyasla daha hevesli olabilir.
Tanımı görmek için chevron_left simgesini tıklayın.
Grup ilişkilendirme önyargısı
Gruba atfetme önyargısı, bireylerin özelliklerini ait oldukları grubun tamamına atfetme eğilimidir. Grupa atfetme önyargısı genellikle aşağıdaki iki biçimde kendini gösterir.
Grup içi önyargı
-
Tanım
Grup içi önyargı, kendinizi de dahil ettiğiniz kendi grubunuzun üyelerine veya sizinle ortak olan özelliklere yönelik bir tercihtir.
-
Örnek
Yazılım geliştiricileri için bir öz geçmiş tarama modeli eğiten iki makine öğrenimi uygulayıcısı, ikisi de aynı bilgisayar bilimleri akademisine katılan adayların bu pozisyon için daha uygun niteliklere sahip olduğuna inanmaya meyilli.
Tanım için chevron_left öğesini tıklayın.
Grup dışı homojenlik önyargısı
-
Tanım
Grup dışı homojenlik önyargısı, ait olmadığınız bir gruptaki bireyleri kalıplara sokma veya bu bireylerin özelliklerini daha "tek tip" olarak görme eğilimidir.
-
Örnek
Yazılım geliştiricileri için bir öz geçmiş tarama modeli eğiten iki makine öğrenimi uygulayıcısı, bir bilgisayar bilimleri akademisine katılmayan tüm başvuru sahiplerinin bu rol için yeterli uzmanlığa sahip olmadığını düşünmeye yatkındır.
Tanım için chevron_left öğesini tıklayın.
Örtülü Önyargı
-
Tanım
Örtülü önyargı, varsayımların kişinin kendi düşünme modeline ve deneyimlerine dayalı olarak, genele uygun olmayan şekilde oluşturulmasıdır.
-
Örnek
Bir jest tanıma modelini eğiten bir yapay zeka uzmanı, kişinin "hayır" kelimesini ifade ettiğini belirtmek için baş sallama özelliğini kullanır. Ancak dünyanın bazı bölgelerinde kafa sallama aslında "evet" anlamına gelir.
Tanımı görmek için chevron_left simgesini tıklayın.
Doğrulama yanlılığı
-
Tanım
Doğrulama yanlılığı, model geliştiriciler verileri bilinçsizce mevcut inanışları ve hipotezleri doğrulayacak şekilde işlediklerinde ortaya çıkar.
-
Örnek
Bir makine öğrenimi uzmanı, çeşitli özelliklere (boy, kilo, cins, ortam) göre köpeklerdeki saldırganlık düzeyini tahmin eden bir model oluşturuyor. Uygulamacı, çocukken hiperaktif bir oyuncak kanişle tatsız bir karşılaşma yaşamış ve o zamandan beri bu cinsi saldırganlık ile ilişkilendirmektedir. Uzman, modelin eğitim verilerini seçerken farkında olmadan küçük köpeklerin uysallığına dair kanıt sağlayan özellikleri atladı.
Tanım için chevron_left öğesini tıklayın.
Deneycinin yanlılığı
-
Tanım
Deneysel önyargı, model oluşturucu orijinal hipoteziyle uyumlu bir sonuç elde edene kadar modeli eğitmeye devam ettiğinde ortaya çıkar.
-
Örnek
Bir makine öğrenimi uzmanı, çeşitli özelliklere (boy, kilo, cins, ortam) göre köpeklerdeki saldırganlık düzeyini tahmin eden bir model oluşturuyor. Uygulamacı, çocukken hiperaktif bir oyuncak kanişle tatsız bir karşılaşma yaşamış ve o zamandan beri bu cinsi saldırganlık ile ilişkilendirmektedir. Eğitimli model, çoğu oyuncak kaniş köpeğinin nispeten uysal olduğunu tahmin ettiğinde uygulayıcı, küçük kaniş köpeklerinin daha saldırgan olduğunu gösteren bir sonuç elde edene kadar modeli birkaç kez daha yeniden eğitti.
Tanım için chevron_left öğesini tıklayın.