Adalet: Bilginizi Test Edin

  1. Doğru veya yanlış: Geçmiş önyargı, bir model eski veriler üzerinde eğitildiğinde ortaya çıkar.

  2. Mühendisler dünyanın dört bir yanındaki yemek tarifi web sitelerinden topladıkları çeşitli özellik verilerine (ör. porsiyon boyutu, malzemeler ve hazırlama teknikleri) dayanarak öğünlerin kalori içeriğini tahmin etmek için bir regresyon modeli eğitiyor. Aşağıdaki veri sorunlarından hangileri daha fazla araştırılması gereken potansiyel yanlılık kaynaklarıdır?

    Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

  3. İğneleme algılama modeli, yetişkinler (18 yaş ve üzeri) tarafından gönderilen 40.000 mesaj ve küçükler (18 yaşından küçük) tarafından gönderilen 40.000 mesaj olmak üzere 80.000 kısa mesaj konusunda eğitilmiştir. Ardından model, yetişkinlerden 10.000 ve küçüklerden 10.000 mesaj olmak üzere 20.000 mesajdan oluşan bir test grubunda değerlendirildi. Aşağıdaki karışıklık matrisleri, her grup için sonuçları göstermektedir (olumlu bir tahmin "alaycı" sınıflandırmasını ifade eder; olumsuz bir tahmin "alaycı değil" sınıflandırmasını ifade eder):

    Yetişkinler

    Gerçek Pozitifler (TP'ler): 512 Yanlış Pozitifler (FP): 51
    Yanlış Negatifler (Yanlış Negatif): 36 Gerçek Negatifler (TN): 9401
    Hassasiyet = TP/(TP + FP) = 0,909
    Geri çağırma = TP/(TP + FN) = 0,934

    Küçükler

    Gerçek Pozitifler (TP'ler): 2147 Yanlış Pozitifler (FP): 96
    Yanlış Negatifler: 2177 Gerçek Negatifler (TN): 5.580
    Hassasiyet = TP/(TP + FP) = 0,957
    Geri çağırma = TP/(TP + FN) = 0,497

    Modelin test grubu performansıyla ilgili aşağıdaki ifadelerden hangisi doğrudur?

    Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

  4. Aşağıdaki hipotezlerden hangisi yukarıdaki alay algılama modeli için test kümesindeki alt grup performansındaki farklılıkları açıklayabilir?

    Uygun gördüğünüz sayıda yanıt seçebilirsiniz.

  5. Mühendisler, yaş demografilerindeki alay algılama doğruluğundaki tutarsızlıkları gidermek için yukarıdaki iğneleme modelini yeniden eğitmek için çalışıyor, ancak model çoktan üretime sunuldu. Aşağıdaki geçici durdurma stratejilerinden hangisi modelin tahminlerindeki hataları azaltmaya yardımcı olur?