หน้านี้ได้รับการแปลโดย Cloud Translation API

ความยุติธรรม: ประเภทของอคติ

โมเดลแมชชีนเลิร์นนิง (ML) ไม่ได้มีวัตถุประสงค์โดยธรรมชาติ ผู้ปฏิบัติงาน ML ฝึกโมเดลด้วยการป้อนชุดข้อมูลของตัวอย่างการฝึก ที่เกี่ยวข้องในการจัดหาและดูแลจัดการข้อมูลนี้สามารถทำให้ การคาดคะเนมีความเสี่ยงต่ออคติ

เมื่อสร้างโมเดล สิ่งสำคัญคือการตระหนักถึงอคติทั่วไปของมนุษย์ที่อาจ ในไฟล์ Manifest ในข้อมูลของคุณ เพื่อให้คุณสามารถดำเนินการเชิงรุกเพื่อลด เอฟเฟกต์

หมายเหตุ: รายการอคติต่อไปนี้เป็นเพียงตัวอย่างอคติเพียงส่วนน้อยที่มักพบในชุดข้อมูลแมชชีนเลิร์นนิง รายการนี้ไม่ได้มีไว้เพื่อแสดงข้อมูลอย่างละเอียด แคตตาล็อกอคติทางปัญญาของวิกิพีเดียแสดงรายการอคติของมนุษย์กว่า 100 ประเภทที่อาจส่งผลต่อการพิจารณาของเรา เมื่อตรวจสอบ ให้ระวังแหล่งที่มาของอคติที่อาจเกิดขึ้นทั้งหลายที่อาจทำให้ การคาดการณ์ของโมเดล

อคติในการรายงาน

คำจำกัดความ

อคติในการรายงานเกิดขึ้นเมื่อความถี่ของ เหตุการณ์ พร็อพเพอร์ตี้ และ/หรือผลลัพธ์ที่บันทึกไว้ในชุดข้อมูลจะไม่ เพื่อแสดงความถี่จริงนั้นอย่างถูกต้อง ความลำเอียงนี้อาจเกิดขึ้นเนื่องจากผู้คนมีแนวโน้มที่จะมุ่งเน้นที่การบันทึกสถานการณ์ที่ผิดปกติหรือน่าจดจําเป็นพิเศษ โดยคิดว่าไม่จำเป็นต้องบันทึกเหตุการณ์ธรรมดา

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

โมเดลการวิเคราะห์ความรู้สึกจะได้รับการฝึกให้คาดการณ์ว่าหนังสือ รีวิวเป็นบวกหรือแง่ลบโดยอิงตามกลุ่มข้อมูลของผู้ใช้ ไปยังเว็บไซต์ยอดนิยม รีวิวส่วนใหญ่ใน ชุดข้อมูลการฝึกอบรมแสดงถึงความคิดเห็นสุดโต่ง (ผู้ตรวจสอบที่ ชอบหรือเกลียดหนังสือ) เพราะผู้คนมีแนวโน้มที่จะส่งหนังสือน้อยลง การทบทวนหนังสือ หากพวกเขาไม่ตอบสนองต่อหนังสือดังกล่าวอย่างแรงกล้า เพื่อ โมเดลก็สามารถคาดการณ์ความรู้สึกได้อย่างถูกต้องน้อยลง ที่ใช้ภาษาที่ละเอียดซับซ้อนกว่าในการอธิบายหนังสือ

คลิก chevron_left เพื่อหาคำจำกัดความ

อคติในอดีต

คำจำกัดความ

การให้น้ำหนักพิเศษในอดีตเกิดขึ้นเมื่อข้อมูลประวัติ สะท้อนให้เห็นถึงความไม่เสมอภาคที่มีอยู่ในโลกในขณะนั้น

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

เมืองที่มีชุดข้อมูลจากช่วงทศวรรษ 1960 มีข้อมูลราคาที่อยู่อาศัย ที่แสดงถึง วิธีการให้กู้ยืมแบบเลือกปฏิบัติที่มีผลบังคับใช้ในระหว่างนั้น ทศวรรษ

คลิก chevron_left เพื่อหาคำจำกัดความ

อคติการทำงานอัตโนมัติ

คำจำกัดความ

ความลำเอียงของการทำงานอัตโนมัติมักมีแนวโน้มที่จะให้ผลลัพธ์มากกว่า ที่เกิดจากระบบอัตโนมัติ ไม่ใช่แบบอัตโนมัติ โดยไม่คำนึงถึงอัตราข้อผิดพลาดของแต่ละระบบ

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

ผู้เชี่ยวชาญด้าน ML ที่ทํางานให้กับผู้ผลิตเฟืองราว ต่างกระตือรือร้นที่จะใช้โมเดล "ล้ำสมัย" ใหม่ที่ฝึกมาเพื่อระบุข้อบกพร่องของฟัน จนกระทั่งผู้ควบคุมโรงงานชี้ให้เห็นว่าทั้งความแม่นยำและอัตราการเรียกคืนของโมเดลนั้นต่ำกว่าของเจ้าหน้าที่ตรวจสอบถึง 15%

คลิก chevron_left เพื่อหาคำจำกัดความ

อคติในการเลือก

การให้น้ำหนักเลือกแบบเกิดขึ้นหาก ตัวอย่างของชุดข้อมูลถูกเลือกในลักษณะที่ไม่สะท้อนถึง การเผยแพร่ในโลกแห่งความเป็นจริง ความลำเอียงในการเลือกอาจอยู่ในรูปแบบต่างๆ ซึ่งรวมถึงความลำเอียงด้านความครอบคลุม ความลำเอียงที่ไม่ตอบ และการเลือกตัวอย่าง

อคติเรื่องความครอบคลุม

คำจำกัดความ

ความคลาดเคลื่อนของการครอบคลุมจะเกิดขึ้นหากไม่ได้เลือกข้อมูลใน แฟชั่นที่ใช้เป็นตัวแทน

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

โมเดลได้รับการฝึกให้คาดการณ์ยอดขายในอนาคตของผลิตภัณฑ์ใหม่โดยอิงตามแบบสํารวจทางโทรศัพท์ที่ดําเนินกับตัวอย่างผู้บริโภคที่ซื้อผลิตภัณฑ์ ผู้บริโภคที่เลือกซื้อผลิตภัณฑ์คู่แข่งแทน ไม่ได้รับการสำรวจ และด้วยเหตุนี้ คนกลุ่มนี้จึงไม่ได้รับ ที่แสดงในข้อมูลการฝึก

คลิก chevron_left เพื่อดูคําจํากัดความ

อคติจากการไม่ตอบ

คำจำกัดความ

อคติจากการไม่ตอบกลับ (หรือที่เรียกว่าอคติในการเข้าร่วม) จะเกิดขึ้นหากข้อมูลไม่ได้แสดงถึงประชากรโดยรวมเนื่องจากช่องว่างในการเข้าร่วมในกระบวนการรวบรวมข้อมูล

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ ผู้บริโภคที่ซื้อผลิตภัณฑ์คู่แข่งเพิ่มขึ้น 80% มีแนวโน้มที่จะปฏิเสธที่จะตอบแบบสอบถาม และข้อมูลของพวกเขา น้อยกว่าความเป็นจริงในตัวอย่าง

คลิก chevron_left เพื่อดูคําจํากัดความ

ความลำเอียงในการสุ่มตัวอย่าง

คำจำกัดความ

การให้น้ำหนักตัวอย่างจะเกิดขึ้น หากมีการสุ่มที่เหมาะสม ในระหว่างการรวบรวมข้อมูล

คลิก chevron_right เพื่อดูตัวอย่าง
ตัวอย่าง

โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ แทนที่จะใช้การกำหนดเป้าหมายผู้บริโภคแบบสุ่ม เลือกผู้บริโภค 200 คนแรกที่ตอบกลับอีเมล ซึ่งอาจเป็น กระตือรือร้นเกี่ยวกับผลิตภัณฑ์นี้มากกว่าคนทั่วไป ผู้ซื้อ

คลิก chevron_left เพื่อดูคําจํากัดความ

การให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม

การให้น้ำหนักพิเศษกับการระบุแหล่งที่มาของกลุ่ม เป็นแนวโน้มที่ผู้คนทั้งกลุ่มเข้าใจในสิ่งที่เป็นจริง เพื่อ ที่ควรจะเป็น อคติในการระบุแหล่งที่มาของกลุ่มมักปรากฏใน 2 สิ่งต่อไปนี้

อคติในกลุ่ม

คำจำกัดความ

อคติภายในกลุ่มคือค่ากำหนดสำหรับสมาชิกของ กลุ่มของคุณเอง คุณก็เป็นสมาชิกเช่นกัน หรือสำหรับลักษณะเฉพาะ ที่คุณแชร์ด้วย

คลิก chevron_right เพื่อดูตัวอย่าง
ตัวอย่าง

ผู้ปฏิบัติงานด้าน ML 2 คนซึ่งฝึกโมเดลคัดกรองใบสมัครสำหรับนักพัฒนาซอฟต์แวร์มีแนวโน้มที่จะเชื่อว่าผู้สมัครที่เรียนที่สถาบันวิทยาการคอมพิวเตอร์เดียวกับตนมีคุณวุฒิมากกว่าสำหรับบทบาทดังกล่าว

คลิก chevron_left เพื่อหาคำจำกัดความ

อคติแบบหนึ่งเดียวนอกกลุ่ม

คำจำกัดความ

อคติความเหมือนกันของกลุ่มภายนอกคือแนวโน้มที่จะตัดสินสมาชิกแต่ละคนในกลุ่มที่คุณไม่ได้เป็นสมาชิก หรือมองว่าลักษณะของสมาชิกกลุ่มนั้นมีความเหมือนกันมากกว่า

คลิก chevron_right เพื่อดูตัวอย่าง
ตัวอย่าง

ผู้ปฏิบัติงาน ML 2 คนฝึกโมเดลการคัดกรองประวัติสำหรับ นักพัฒนาซอฟต์แวร์ถูกเลือกให้เชื่อว่าผู้สมัครทุกราย ที่ไม่ได้เข้าเรียนในสถาบันด้านวิทยาการคอมพิวเตอร์จะไม่มี ความเชี่ยวชาญที่เพียงพอสำหรับบทบาทนั้น

คลิก chevron_left เพื่อดูคําจํากัดความ

การให้น้ำหนักพิเศษโดยนัย

คำจำกัดความ

อคติโดยปริยายเมื่อมีการตั้งสมมติฐาน โดยใช้รูปแบบการคิดและประสบการณ์ส่วนตัว ไม่จำเป็นนักสำหรับกรณีทั่วๆ ไป

คลิก chevron_right เพื่อดูตัวอย่าง
ตัวอย่าง

ผู้ปฏิบัติงาน ML ที่ฝึกโมเดลการจดจำท่าทางสัมผัสใช้ ส่ายหัวเป็น คุณลักษณะที่บ่งบอกว่าบุคคลหนึ่งกำลังสื่อสารคำว่า "ไม่" แต่ในบางภูมิภาคของโลก แสดงว่า "ใช่"

คลิก chevron_left เพื่อดูคําจํากัดความ

อคติยืนยันความคิดตัวเอง

คำจำกัดความ

การให้น้ำหนักพิเศษในการยืนยันเกิดขึ้นเมื่อเครื่องสร้างโมเดล ประมวลผลข้อมูลในลักษณะที่ยืนยันความเชื่อเดิมๆ แบบไม่รู้ตัว และสมมติฐาน

คลิก chevron_right เป็นตัวอย่าง
ตัวอย่าง

ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าว ในสุนัขตามคุณสมบัติต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อมของคุณ) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อดูแลจัดการข้อมูลการฝึกของโมเดล นักปฏิบัติได้ทิ้งฟีเจอร์ที่แสดงหลักฐานว่าสุนัขตัวเล็กเชื่อฟังโดยไม่รู้ตัว

คลิก chevron_left เพื่อหาคำจำกัดความ

อคติของผู้ทำการทดสอบ

คำจำกัดความ

ความลำเอียงของผู้ทดสอบเกิดขึ้นเมื่อผู้สร้างโมเดล ฝึกโมเดลต่อไปจนกว่าจะสร้างผลลัพธ์ที่สอดคล้องกับ สมมติฐานเดิมของพวกเขา

คลิก chevron_right เพื่อดูตัวอย่าง
ตัวอย่าง

ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าวของสุนัขโดยอิงตามลักษณะต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อม) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อโมเดลที่ผ่านการฝึกคาดการณ์มากที่สุด สุนัขพันธุ์พุดเดิลทอยให้ค่อนข้างดื้อดึง ผู้ปฏิบัติงานก็ฝึก โมเดลนี้อีกหลายครั้งจนกว่าจะได้ผลลัพธ์ที่แสดง สุนัขพันธุ์พุดเดิ้ลพันธุ์เล็กเพื่อให้มีความรุนแรงมากขึ้น

คลิก chevron_left เพื่อหาคำจำกัดความ

แบบฝึกหัด: ตรวจสอบความเข้าใจ

อคติประเภทใดต่อไปนี้ที่อาจทำให้เกิด กับการคาดการณ์ที่บิดเบือนในรูปแบบการรับเข้ามหาวิทยาลัยที่อธิบายไว้ ใน บทนำ

ความลำเอียงตามประวัติศาสตร์

รูปแบบการรับนักศึกษาได้รับการฝึกจากบันทึกข้อมูลของนักเรียนในอดีต 20 ปี หากข้อมูลนี้แสดงถึงนักเรียนซึ่งเป็นชนกลุ่มน้อย โมเดลอาจจำลองความไม่เสมอภาคเดียวกันในอดีต เมื่อคาดการณ์ ข้อมูลของนักเรียนใหม่

อคติต่อกลุ่มในเครื่อง

โมเดลการรับเข้าศึกษาได้รับการฝึกจากนักศึกษามหาวิทยาลัยในปัจจุบัน ซึ่งอาจมีความชอบที่ไม่ตั้งใจในการรับนักเรียนที่มาจากภูมิหลังคล้ายกับตนเอง ซึ่งอาจส่งผลต่อวิธีที่ดูแลจัดการหรือดัดแปลงข้อมูลเพื่อใช้ฝึกโมเดล

อคติยืนยันความคิดตัวเอง

รูปแบบการรับนักศึกษาได้รับการฝึกโดยนักศึกษามหาวิทยาลัยในปัจจุบัน ซึ่งน่าจะมีความเชื่อเดิมๆ เกี่ยวกับคุณสมบัติ สัมพันธ์กับความสำเร็จในโปรแกรมวิทยาการคอมพิวเตอร์ สิ่งที่ทำได้ ดูแลจัดการหรือปรับปรุงฟีเจอร์ข้อมูลโดยไม่ได้ตั้งใจ เพื่อให้ข้อมูลดังกล่าว โมเดลได้ยืนยันความเชื่อที่มีอยู่นี้

อคติการทำงานอัตโนมัติ

ความลำเอียงของการทำงานอัตโนมัติอาจอธิบายได้ว่าทำไมคณะกรรมการการรับเข้าศึกษาจึงเลือก ใช้โมเดล ML เพื่อตัดสินใจรับสมัครงาน อาจมี เชื่อว่าระบบอัตโนมัติจะให้ผลลัพธ์ที่ดีกว่า ตัดสินใจได้ด้วยตนเอง อย่างไรก็ตาม ความลำเอียงของการทำงานอัตโนมัติ ข้อมูลเชิงลึกว่าเหตุใดการคาดการณ์ของโมเดลจึงบิดเบือน

ช่วงแนะนำ (5 นาที)

การระบุการให้น้ำหนักพิเศษ (10 นาที)

ความยุติธรรม: ประเภทของอคติ

อคติในการรายงาน

คำจำกัดความ

ตัวอย่าง

อคติในอดีต

คำจำกัดความ

ตัวอย่าง

อคติการทำงานอัตโนมัติ

คำจำกัดความ

ตัวอย่าง

อคติในการเลือก

อคติเรื่องความครอบคลุม

คำจำกัดความ

ตัวอย่าง

อคติจากการไม่ตอบ

คำจำกัดความ

ตัวอย่าง

ความลำเอียงในการสุ่มตัวอย่าง

คำจำกัดความ

ตัวอย่าง

การให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม

อคติในกลุ่ม

คำจำกัดความ

ตัวอย่าง

อคติแบบหนึ่งเดียวนอกกลุ่ม

คำจำกัดความ

ตัวอย่าง

การให้น้ำหนักพิเศษโดยนัย

คำจำกัดความ

ตัวอย่าง

อคติยืนยันความคิดตัวเอง

คำจำกัดความ

ตัวอย่าง

อคติของผู้ทำการทดสอบ

คำจำกัดความ

ตัวอย่าง

แบบฝึกหัด: ตรวจสอบความเข้าใจ