ความยุติธรรม: ทดสอบความรู้ของคุณ

  1. จริงหรือเท็จ: การให้น้ำหนักพิเศษในอดีตจะเกิดขึ้นเมื่อโมเดลได้รับการฝึกกับข้อมูลเก่า

  2. วิศวกรกำลังฝึกโมเดลการถดถอยเพื่อคาดการณ์ปริมาณแคลอรีของมื้ออาหาร โดยอิงตามข้อมูลหลากหลายที่รวบรวมมาจากเว็บไซต์สูตรอาหารทั่วโลก รวมถึงขนาดหน่วยบริโภค ส่วนผสม และเทคนิคการเตรียมอาหาร ปัญหาเกี่ยวกับข้อมูลข้อใดต่อไปนี้คือแหล่งที่มาของอคติที่อาจเกิดขึ้นซึ่งควรตรวจสอบเพิ่มเติม

    เลือกคำตอบได้มากเท่าที่คุณเห็นว่าเหมาะสม

  3. โมเดลตรวจจับการถากถางได้รับการฝึกผ่าน SMS จำนวน 80,000 ข้อความ โดยข้อความ 40,000 รายการที่ผู้ใหญ่ (อายุ 18 ปีขึ้นไป) ส่ง และ 40,000 ข้อความที่ผู้เยาว์ (อายุต่ำกว่า 18 ปี) ส่ง จากนั้นจึงประเมินโมเดลดังกล่าวในชุดทดสอบที่มีข้อความ 20,000 ข้อความ โดย 10,000 ข้อความจากผู้ใหญ่ และ 10,000 ข้อความจากผู้เยาว์ เมทริกซ์ความสับสนต่อไปนี้จะแสดงผลลัพธ์ของแต่ละกลุ่ม (การคาดคะเนเชิงบวกหมายถึงการจัดประเภทแบบ "ล้อเลียน" ส่วนการคาดคะเนเชิงลบหมายถึงการจัดประเภทแบบ "ไม่ใช่การเสียดสี"):

    ผู้ใหญ่

    ผลบวกจริง (TP): 512 ผลบวกลวง (FP): 51
    ผลลบลวง (FN): 36 ผลลบจริง (TN): 9401
    ความแม่นยำ = TP/(TP + FP) = 0.909
    ความอ่อนไหว = TP/(TP + FN) = 0.934

    ผู้เยาว์

    ผลบวกจริง (TP): 2147 ผลบวกลวง (FP): 96
    ผลลบลวง (FN): 2,177 ผลลบจริง (TN): 5580
    ความแม่นยำ = TP/(TP + FP) = 0.957
    ความอ่อนไหว = TP/(TP + FN) = 0.497

    ข้อใดต่อไปนี้เป็นจริงเกี่ยวกับประสิทธิภาพของชุดทดสอบของโมเดล

    เลือกคำตอบได้มากเท่าที่คุณเห็นว่าเหมาะสม

  4. สมมติฐานใดต่อไปนี้อธิบายถึงความแตกต่างของประสิทธิภาพของกลุ่มย่อยในชุดทดสอบสำหรับรูปแบบการตรวจหาการประชดประชันข้างต้นได้

    เลือกคำตอบได้มากเท่าที่คุณเห็นว่าเหมาะสม

  5. วิศวกรกำลังฝึกรูปแบบการเสียดสีด้านบนเพื่อจัดการกับความไม่สอดคล้องในความแม่นยำของการตรวจหาการประชดประชันในประชากรอายุต่างๆ แต่โมเดลได้เผยแพร่เข้าสู่การใช้งานจริงแล้ว กลยุทธ์อุดช่องว่างใดต่อไปนี้จะช่วยลดข้อผิดพลาดในการคาดการณ์ของโมเดลได้