Adalet: Bilginizi Test Edin | Google for Developers

Doğru veya yanlış: Geçmiş önyargı, bir model eski veriler üzerinde eğitildiğinde ortaya çıkar.

Doğru

Yanlış

Mühendisler dünyanın dört bir yanındaki yemek tarifi web sitelerinden topladıkları çeşitli özellik verilerine (ör. porsiyon boyutu, malzemeler ve hazırlama teknikleri) dayanarak öğünlerin kalori içeriğini tahmin etmek için bir regresyon modeli eğitiyor. Aşağıdaki veri sorunlarından hangileri daha fazla araştırılması gereken potansiyel yanlılık kaynaklarıdır?

Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

40.000 eğitim örneğinden yaklaşık 4.000'inde "yayın boyutu" özelliği için bir değer eksikti.

Eğitim örneklerinin yaklaşık 5.000'inde İngiliz ölçü birimleri (ons, pound vb.) bulunurken diğer 35.000 örnekte metrik ölçü birimleri (gram, litre vb.) kullanılmaktadır.

40.000 eğitim örneğinden yaklaşık 100'ünde, yanlış olabilecek malzeme değerleri (ör. 100 çubuk tereyağı).

Bazı popüler öğünler, diğer popüler öğünlere kıyasla eğitim verilerinde yeterince temsil edilmemişti (örneğin, dosa için 200 eğitim örneği varken pizza için yalnızca 10 öğün).

İğneleme algılama modeli, yetişkinler (18 yaş ve üzeri) tarafından gönderilen 40.000 mesaj ve küçükler (18 yaşından küçük) tarafından gönderilen 40.000 mesaj olmak üzere 80.000 kısa mesaj konusunda eğitilmiştir. Ardından model, yetişkinlerden 10.000 ve küçüklerden 10.000 mesaj olmak üzere 20.000 mesajdan oluşan bir test grubunda değerlendirildi. Aşağıdaki karışıklık matrisleri, her grup için sonuçları göstermektedir (olumlu bir tahmin "alaycı" sınıflandırmasını ifade eder; olumsuz bir tahmin "alaycı değil" sınıflandırmasını ifade eder):

Yetişkinler

Gerçek Pozitifler (TP'ler): 512	Yanlış Pozitifler (FP): 51
Yanlış Negatifler (Yanlış Negatif): 36	Gerçek Negatifler (TN): 9401
Hassasiyet = TP/(TP + FP) = 0,909
Geri çağırma = TP/(TP + FN) = 0,934

Küçükler

Gerçek Pozitifler (TP'ler): 2147	Yanlış Pozitifler (FP): 96
Yanlış Negatifler: 2177	Gerçek Negatifler (TN): 5.580
Hassasiyet = TP/(TP + FP) = 0,957
Geri çağırma = TP/(TP + FN) = 0,497

Modelin test grubu performansıyla ilgili aşağıdaki ifadelerden hangisi doğrudur?

Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

Model, yetişkinlerden alınan örneklerde küçüklere kıyasla daha iyi performans gösterir.

Yetişkinler tarafından gönderilen 10.000 mesaj,sınıf dengesiz bir veri kümesidir.

Küçükler tarafından gönderilen 10.000 mesaj sınıf dengesiz bir veri kümesidir.

Küçükler tarafından gönderilen iletilerin yaklaşık% 50'si yanlış şekilde "alaycı" olarak sınıflandırılıyor.

Model, küçüklerin alaycı mesajlarının yaklaşık% 50'sini "alaycı" olarak sınıflandıramaz.

Aşağıdaki hipotezlerden hangisi yukarıdaki alay algılama modeli için test kümesindeki alt grup performansındaki farklılıkları açıklayabilir?

Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

Model, "alaycı" tahminlerde bulunmaktan çok yanılıyor. Bu nedenle reşit olmayan bireyleri sınıflandırırken daha fazla hata yapılmaktadır. kısa mesajlara yer vermelidir. Çünkü test grubunda küçüklerden gelen alaycı mesajlar daha fazladır.

Model, yetişkinlerden ziyade küçüklere ait daha olumsuz (alaycı olmayan) örnekler üzerinden değerlendirilmiştir. Bu da küçüklerde daha fazla hataya yol açmıştır.

Küçüklerin gönderdiği kısa mesajlarda alaycı davranılması daha zor olduğu için bu modelin işaretlenme olasılığı daha düşüktü.

Yetişkinlerden gelen alaycı mesajlar, küçüklerden gelenlere kıyasla çok daha azdır. Model, sınıf açısından daha dengeli bir dizi yetişkin iletisi üzerinde değerlendirilmişse söz konusu alt grup için geri çağırma düşebilir.

Mühendisler, yaş demografilerindeki alay algılama doğruluğundaki tutarsızlıkları gidermek için yukarıdaki iğneleme modelini yeniden eğitmek için çalışıyor, ancak model çoktan üretime sunuldu. Aşağıdaki geçici durdurma stratejilerinden hangisi modelin tahminlerindeki hataları azaltmaya yardımcı olur?

Modelin kullanımını küçük yaştaki kullanıcılar tarafından gönderilen kısa mesajlarla sınırlandırın.

Model çıktısını, modelin başlangıçta ne tahmin ettiğinden bağımsız olarak, küçükler tarafından gönderilen tüm kısa mesajlar için "alaycı" değerini döndürecek şekilde ayarlayın.

Model, küçükler tarafından gönderilen kısa mesajlar için "alaycı değil" tahmininde bulunduğunda çıkışı, "emin değil" değerini döndürecek şekilde ayarlayın.