เกณฑ์และเมทริกซ์ความสับสน

สมมติว่าคุณมีโมเดลการถดถอยแบบโลจิสติกส์สำหรับการตรวจหาอีเมลสแปมที่ คาดการณ์ค่าระหว่าง 0 ถึง 1 ซึ่งแสดงถึงความน่าจะเป็นที่กำหนดให้ อีเมลเป็นสแปม การคาดการณ์ของ 0.50 หมายความว่ามีแนวโน้ม 50% ที่อีเมลนั้นๆ จดหมายขยะ การคาดการณ์ที่มีค่าเท่ากับ 0.75 หมายความว่ามีแนวโน้ม 75% ที่อีเมลดังกล่าวเป็นสแปม เป็นต้น

คุณต้องการใช้งานโมเดลนี้ในแอปพลิเคชันอีเมลเพื่อกรองสแปม โฟลเดอร์อีเมลแยกต่างหาก แต่การจะทำเช่นนั้น คุณต้องแปลงข้อมูลดิบของโมเดล เอาต์พุตที่เป็นตัวเลข (เช่น 0.75) เป็น 1 ใน 2 หมวดหมู่ ได้แก่ "สแปม" หรือ "ไม่" สแปม"

ในการทำ Conversion นี้ คุณจะต้องเลือกความน่าจะเป็นที่เป็นเกณฑ์ ซึ่งเรียกว่า เกณฑ์การแยกประเภท จากนั้นระบบจะกำหนดตัวอย่างที่มีความเป็นไปได้สูงกว่าค่าเกณฑ์ ไปยังคลาสเชิงบวก ชั้นเรียนที่คุณกำลังทดสอบ (ที่นี่ spam) ตัวอย่างที่มี ความน่าจะเป็นจะกำหนดไว้สำหรับคลาสเชิงลบ คลาสอื่น (ที่นี่ not spam)

คลิกที่นี่เพื่อดูรายละเอียดเพิ่มเติมเกี่ยวกับเกณฑ์การจัดประเภท

คุณอาจสงสัยว่าจะเกิดอะไรขึ้นหากคะแนนที่คาดการณ์เท่ากับ เกณฑ์การจัดประเภท (เช่น คะแนน 0.5 โดยที่ เกณฑ์การจัดประเภทจะเท่ากับ 0.5 ด้วย) การจัดการสำหรับเคสนี้ ขึ้นอยู่กับการใช้งานเฉพาะที่เลือกสำหรับการแยกประเภท โมเดล ตัวอย่างเช่น Keras ไลบรารีจะคาดการณ์คลาสลบหากคะแนนและเกณฑ์ เท่ากัน แต่เครื่องมือ/เฟรมเวิร์กอื่นๆ อาจจัดการกับกรณีนี้ได้ แตกต่างกัน

ตัวอย่างเช่น สมมติว่าโมเดลให้คะแนนอีเมลหนึ่งเป็น 0.99 โดยคาดการณ์ว่า อีเมลนั้นมีโอกาส 99% ที่จะเป็นจดหมายขยะ และอีเมลอีกฉบับ 0.51, การคาดการณ์มีโอกาส 51% ที่จะเป็นสแปม หากคุณตั้งค่า เกณฑ์การจัดประเภทเป็น 0.5 โมเดลจะจัดประเภทอีเมลทั้งสองเป็น จดหมายขยะ หากคุณกำหนดเกณฑ์เป็น 0.95 จะมีเฉพาะคะแนนอีเมล 0.99 เท่านั้น อาจถูกจัดประเภทว่าเป็นสแปม

แม้ว่าค่า 0.5 อาจดูเป็นเกณฑ์ที่ใช้ง่าย แต่ไม่ใช่ความคิดที่ดีหาก ประเภทของการจัดประเภทที่ไม่ถูกต้องมีต้นทุนสูงกว่าประเภทอื่น หรือหาก คลาสมีความไม่สมดุล หากมีอีเมลเพียง 0.01% เป็นจดหมายขยะหรือมีการส่งผิด อีเมลที่ถูกต้องนั้นแย่กว่าการส่งสแปมเข้าสู่กล่องจดหมาย ติดป้ายกำกับทุกสิ่งที่โมเดลพิจารณาว่าอย่างน้อย 50% มีแนวโน้มที่จะเป็นสแปม เนื่องจากสแปมจะก่อให้เกิดผลลัพธ์ที่ไม่พึงประสงค์

เมตริกความสับสน

คะแนนความน่าจะเป็นไม่ใช่ความเป็นจริง หรือ ข้อมูลจากการสังเกตการณ์โดยตรง ผลลัพธ์แต่ละรายการจากตัวแยกประเภทแบบไบนารีมีผลลัพธ์ที่เป็นไปได้ 4 รายการ สำหรับตัวอย่างตัวแยกประเภทสแปม ถ้าคุณแสดงข้อมูลที่ถูกต้องเป็นคอลัมน์ และการคาดการณ์ของโมเดลเป็นแถว ตารางต่อไปนี้เรียกว่า เมทริกซ์ความสับสน คือ ผลลัพธ์:

ผลบวกจริง ผลลบจริง
คาดการณ์ไว้ในแง่บวก ผลบวกจริง (TP): สแปม ที่มีการจัดประเภทอีเมลเป็นจดหมายขยะอย่างถูกต้อง นี่คือข้อความสแปม ไปยังโฟลเดอร์จดหมายขยะโดยอัตโนมัติ ผลบวกลวง (FP): อีเมลที่ไม่ใช่สแปมที่มีการจัดประเภทผิดเป็น จดหมายขยะ นี่คืออีเมลที่ถูกต้องซึ่ง อยู่ในโฟลเดอร์จดหมายขยะ
ค่าลบที่คาดการณ์ เท็จ เชิงลบ (FN): อีเมลสแปมมีการจัดประเภทผิดว่าไม่ใช่สแปม นี่เป็นสแปม อีเมลที่ไม่ใช่ ที่ตัวกรองจดหมายขยะดักไว้และเข้าไปยังกล่องจดหมาย ผลลบจริง (TN): A อีเมลที่ไม่ใช่สแปมมีการจัดประเภทอย่างถูกต้องว่าไม่ใช่สแปม นี่คืออีเมลที่ถูกต้องซึ่งส่ง โดยตรงในกล่องจดหมาย

โปรดสังเกตว่าจำนวนรวมในแต่ละแถวจะให้ค่าบวกที่คาดการณ์ไว้ทั้งหมด (TP + FP) และ ค่าลบที่คาดการณ์ทั้งหมด (FN + TN) โดยไม่คำนึงถึงความถูกต้อง ผลรวมในแต่ละรายการ ในขณะเดียวกัน จะให้ผลบวกจริงทั้งหมด (TP + FN) และผลลบจริงทั้งหมด (FP + TN) โดยไม่คำนึงถึงการจัดประเภทโมเดล

เมื่อยอดรวมของผลบวกจริงไม่ได้ใกล้เคียงกับยอดรวมจริง ชุดข้อมูลจะตรงกัน ไม่สมดุล อินสแตนซ์ ของชุดข้อมูลที่ไม่สมดุลกันอาจเป็นชุดภาพเมฆหลายพันภาพ กลุ่มเมฆหายากที่คุณสนใจ เช่น กลุ่มเมฆขนาดใหญ่ ปรากฏเฉพาะ 2-3 ครั้ง