ความแม่นยําเป็นเมตริกหนึ่งในการประเมินโมเดลการแยกประเภท อย่างไม่เป็นทางการ ความถูกต้องแม่นยําเป็นเศษส่วนของการคาดการณ์ที่โมเดลของเราทําให้ถูกต้อง ความแม่นยําถูกต้อง มีดังต่อไปนี้
สําหรับการแยกประเภทไบนารี ระบบจะคํานวณความแม่นยําทั้งในด้านบวกและด้านลบได้ดังนี้
โดยที่ TP = ผลบวกจริง, TN = ค่าลบจริง, FP = ผลบวกลวง และ FN = ผลลบลวง
มาลองคํานวณความแม่นยําสําหรับโมเดลต่อไปนี้ซึ่งจัดเป็น 100 เนื้องอกเป็นร้ายแรง (คลาสเชิงบวก) หรือไม่ร้ายแรง (คลาสเชิงลบ) ดังนี้
True Positive (TP):
|
False Positive (FP):
|
FalseFalse (FN):
|
True true (TN)
|
ความแม่นยําที่ได้คือ 0.91 หรือ 91% (การคาดการณ์ที่ถูกต้อง 91 รายการจากทั้งหมด 100 รายการ) นั่นหมายความว่าตัวแยกประเภทเนื้องอกของเราทํางานได้ดี ในการระบุตัวร้ายใช่ไหม
ที่จริง เรามาวิเคราะห์เชิงบวกและเชิงลบกันอย่างละเอียดมากขึ้นเพื่อให้ได้ข้อมูลเชิงลึกเกี่ยวกับประสิทธิภาพของโมเดลของเรามากขึ้น
จากตัวอย่างเนื้องอก 100 ตัวอย่าง 91 ไม่เป็นอันตราย (90 TN และ 1 FPS) และ 9 เป็นภัย (1 TP และ 8 FN)
จากเนื้องอกที่ไม่เป็นอันตราย 91 รายการ โมเดลระบุว่า 90 นั้นไม่เป็นอันตราย เยี่ยมเลย อย่างไรก็ตาม จากเนื้องอกที่เป็นอันตราย 9 รายการ รูปแบบจะระบุเพียง 1 ว่าเป็น "อันตราย" เท่านั้น ซึ่งเป็นผลลัพธ์ที่ยอดเยี่ยม เนื่องจากเนื้อร้าย 8 จาก 9 รายการมีรูปแบบไม่ถูกต้อง
แม้ว่าความแม่นยํา 91% อาจดูดีเมื่อมองผ่านครั้งแรก แต่โมเดลตัวแยกประเภทเนื้ออีกตัวที่คาดการณ์ความไม่เป็นอันตรายนั้น มักจะมีความแม่นยําเท่ากัน (การคาดการณ์ที่ถูกต้อง 91/100) ในตัวอย่างของเรา กล่าวอีกนัยหนึ่งคือ โมเดลของเราไม่ได้ดีไปกว่าแบบเชิงคาดการณ์ ที่สามารถแยกเนื้องอกร้ายออกจากเนื้องอกที่ไม่เป็นอันตรายได้
ความแม่นยําเพียงอย่างเดียวไม่ได้บอกเรื่องราวทั้งหมดเมื่อคุณทํางานด้วยชุดข้อมูลที่ไม่สมดุลเช่นนี้ ซึ่งมีความต่างระหว่างจํานวนป้ายกํากับเชิงบวกกับป้ายกํากับเชิงลบ
ในส่วนถัดไป เราจะดูเมตริก 2 อย่างที่ดีกว่านี้ สําหรับการประเมินปัญหาที่ไม่สมดุลกัน ได้แก่ ความแม่นยําและการจดจํา