หน้านี้มีคำศัพท์ในพจนานุกรม AI ที่มีความรับผิดชอบ ดูคำศัพท์ทั้งหมดได้โดยคลิกที่นี่
A
แอตทริบิวต์
คำพ้องความหมายของฟีเจอร์
ในความเท่าเทียมของแมชชีนเลิร์นนิง แอตทริบิวต์มักหมายถึง ลักษณะที่เกี่ยวข้องกับบุคคล
อคติในการทำงานอัตโนมัติ
เมื่อผู้มีอำนาจตัดสินใจที่เป็นมนุษย์เลือกใช้คำแนะนำที่ระบบการตัดสินใจอัตโนมัติสร้างขึ้นมากกว่าข้อมูลที่สร้างขึ้นโดยไม่มีการทำงานอัตโนมัติ แม้ว่าระบบการตัดสินใจอัตโนมัติจะทำผิดพลาดก็ตาม
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของ อคติ ในหลักสูตรเร่งรัดแมชชีนเลิร์นนิง
B
อคติ (จริยธรรม/ความเป็นธรรม)
1. การเหมารวม อคติ หรือการเข้าข้างสิ่งต่างๆ บุคคล หรือกลุ่มบางกลุ่มมากกว่ากลุ่มอื่นๆ อคติเหล่านี้อาจส่งผลต่อการเก็บรวบรวมและการตีความข้อมูล การออกแบบระบบ และวิธีที่ผู้ใช้โต้ตอบกับระบบ รูปแบบของอคติประเภทนี้ ได้แก่
- อคติในการทำงานอัตโนมัติ
- อคติยืนยันความคิดตัวเอง
- อคติของผู้ทดลอง
- อคติในการระบุแหล่งที่มาของกลุ่ม
- อคติโดยไม่รู้ตัว
- อคติในกลุ่ม
- อคติเกี่ยวกับความเหมือนกันของกลุ่มนอก
2. ข้อผิดพลาดของระบบที่เกิดจากขั้นตอนการสุ่มตัวอย่างหรือการรายงาน รูปแบบของอคติประเภทนี้ ได้แก่
- อคติในการครอบคลุม
- ความลำเอียงเนื่องจากไม่ได้ตอบ
- อคติในการเข้าร่วม
- อคติในการรายงาน
- อคติในการสุ่มตัวอย่าง
- อคติในการเลือก
อย่าสับสนกับคำอคติในโมเดลแมชชีนเลิร์นนิง หรืออคติในการคาดการณ์
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติใน หลักสูตรเร่งรัดแมชชีนเลิร์นนิง
C
อคติยืนยันความคิดตัวเอง
แนวโน้มที่จะค้นหา ตีความ ชื่นชอบ และจดจำข้อมูลใน ลักษณะที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ก่อนแล้ว นักพัฒนาแมชชีนเลิร์นนิงอาจเก็บรวบรวมหรือติดป้ายกำกับ ข้อมูลโดยไม่ตั้งใจในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่ อคติยืนยันความคิดตัวเองเป็นรูปแบบหนึ่งของอคติแฝง
อคติของผู้ทดลองเป็นรูปแบบหนึ่งของอคติในการยืนยัน ซึ่งผู้ทดลองจะฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่ก่อนแล้ว
ความเป็นธรรมแบบข้อเท็จจริง
เมตริกความเป็นธรรมที่ตรวจสอบว่าโมเดลการจัดประเภทให้ผลลัพธ์เดียวกันสำหรับบุคคลหนึ่งกับอีกบุคคลหนึ่งซึ่งเหมือนกับบุคคลแรกหรือไม่ ยกเว้นในส่วนของแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินโมเดลการจัดประเภทเพื่อความเป็นธรรมแบบข้อเท็จจริง เป็นวิธีหนึ่งในการระบุแหล่งที่มาของความเอนเอียงที่อาจเกิดขึ้นในโมเดล
โปรดดูข้อมูลเพิ่มเติมในแหล่งข้อมูลต่อไปนี้
- ความเป็นธรรม: ความเป็นธรรมแบบข้อเท็จจริงที่ขัดแย้ง ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง
- เมื่อโลกมาบรรจบกัน: การผสานรวมสมมติฐานแบบ Counterfactual ที่แตกต่างกัน ในความเท่าเทียม
อคติในการครอบคลุม
D
ความเท่าเทียมทางประชากร
เมตริกความเป็นธรรมที่ตรงตามเงื่อนไขต่อไปนี้ ผลลัพธ์ของการจัดประเภทของโมเดลไม่ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนที่กำหนด
ตัวอย่างเช่น หากทั้งชาวลิลิพุตและชาวโบรบดิงแนกสมัครเข้าเรียนที่มหาวิทยาลัยกลับบ์ดับดริบ ความเท่าเทียมกันทางประชากรจะเกิดขึ้นหากเปอร์เซ็นต์ของชาวลิลิพุตที่ได้รับการตอบรับเท่ากับเปอร์เซ็นต์ของชาวโบรบดิงแนกที่ได้รับการตอบรับ ไม่ว่ากลุ่มใดกลุ่มหนึ่งจะมีคุณสมบัติมากกว่าอีกกลุ่มหนึ่งโดยเฉลี่ยหรือไม่ก็ตาม
แตกต่างจากโอกาสที่เท่าเทียมกันและความเท่าเทียมกันของโอกาส ซึ่งอนุญาตให้ผลการจัดประเภทโดยรวมขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน แต่ไม่อนุญาตให้ผลการจัดประเภทสำหรับป้ายกำกับความจริงพื้นฐานที่ระบุบางอย่างขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน ดูภาพ ที่อธิบายถึงการแลกเปลี่ยนเมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมกันทางประชากรศาสตร์ได้ใน"การต่อสู้กับการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น"
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ความเท่าเทียมกันทางประชากร ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง
ผลกระทบที่แตกต่าง
การตัดสินใจเกี่ยวกับผู้คนซึ่งส่งผลกระทบต่อกลุ่มย่อยของประชากรที่แตกต่างกันอย่างไม่สมส่วน โดยปกติแล้วจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจแบบอัลกอริทึมส่งผลเสียหรือส่งผลดีต่อกลุ่มย่อยบางกลุ่มมากกว่ากลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่พิจารณาการมีสิทธิ์ของชาวลิลิพุต ในการขอสินเชื่อบ้านขนาดเล็กมีแนวโน้มที่จะจัดประเภท ชาวลิลิพุตเป็น "ไม่มีสิทธิ์" หากที่อยู่จัดส่งมีรหัสไปรษณีย์ที่เฉพาะเจาะจง หากชาวลิลิพุตแบบ Big-Endian มีแนวโน้มที่จะมี ที่อยู่จัดส่งที่มีรหัสไปรษณีย์นี้มากกว่าชาวลิลิพุตแบบ Little-Endian อัลกอริทึมนี้อาจส่งผลให้เกิดผลกระทบที่ไม่เท่าเทียมกัน
แตกต่างจากการเลือกปฏิบัติ ซึ่งมุ่งเน้นความแตกต่างที่เกิดขึ้นเมื่อลักษณะของกลุ่มย่อย เป็นอินพุตที่ชัดเจนในกระบวนการตัดสินใจของอัลกอริทึม
การเลือกปฏิบัติ
การนำแอตทริบิวต์ที่ละเอียดอ่อนของกลุ่มตัวอย่าง มาพิจารณาในกระบวนการตัดสินใจแบบอัลกอริทึมเพื่อให้ กลุ่มย่อยต่างๆ ของผู้คนได้รับการปฏิบัติที่แตกต่างกัน
ตัวอย่างเช่น ลองพิจารณาอัลกอริทึมที่ พิจารณาการมีสิทธิ์ของชาวลิลิพุตในการขอสินเชื่อบ้านขนาดเล็กตาม ข้อมูลที่ระบุในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้ความสัมพันธ์ของ ลิลิพิวเทียนเป็น Big-Endian หรือ Little-Endian เป็นอินพุต อัลกอริทึม จะใช้การปฏิบัติที่แตกต่างกันตามมิตินั้น
แตกต่างจากผลกระทบที่ไม่เท่าเทียมกัน ซึ่งมุ่งเน้น ความแตกต่างในผลกระทบทางสังคมของการตัดสินใจตามอัลกอริทึมที่มีต่อกลุ่มย่อย โดยไม่คำนึงว่ากลุ่มย่อยเหล่านั้นจะเป็นอินพุตของโมเดลหรือไม่
E
ความเท่าเทียมกันในโอกาส
เมตริกความเป็นธรรมเพื่อประเมินว่าโมเดล คาดการณ์ผลลัพธ์ที่ต้องการได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่ละเอียดอ่อนหรือไม่ กล่าวอีกนัยหนึ่งคือ หากคลาสที่เป็นบวกคือผลลัพธ์ที่ต้องการสำหรับโมเดล เป้าหมายคือการทำให้อัตราผลบวกจริงเท่ากันสำหรับทุกกลุ่ม
ความเท่าเทียมกันของโอกาสเกี่ยวข้องกับอัตราส่วนที่เท่ากัน ซึ่งกำหนดให้ทั้งอัตราผลบวกจริงและ อัตราผลบวกลวงต้องเท่ากันสำหรับทุกกลุ่ม
สมมติว่ามหาวิทยาลัยกลับดับดริบรับทั้งชาวลิลิปุตและชาวบรอบดิงแนก เข้าโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมของชาวลิลิพุตมี หลักสูตรที่แข็งแกร่งสำหรับชั้นเรียนคณิตศาสตร์ และนักเรียนส่วนใหญ่ มีคุณสมบัติเหมาะสมสำหรับโปรแกรมมหาวิทยาลัย โรงเรียนมัธยมศึกษาของชาวบร็อบดิงแน็กไม่มี ชั้นเรียนคณิตศาสตร์เลย และด้วยเหตุนี้ นักเรียนของพวกเขาจึงมี คุณสมบัติน้อยกว่ามาก โอกาสที่เท่าเทียมกันจะเกิดขึ้นสำหรับป้ายกำกับที่ต้องการ "รับเข้า" ในเรื่องสัญชาติ (ลิลิพุตหรือบร็อบดิงแนก) หากนักเรียนที่มีคุณสมบัติเหมาะสมมีโอกาสเท่ากันที่จะได้รับการรับเข้า ไม่ว่าจะเป็นชาวลิลิพุตหรือชาวบร็อบดิงแนก
ตัวอย่างเช่น สมมติว่ามีชาวลิลิพุต 100 คนและชาวโบรบดิงแนก 100 คนสมัครเข้าเรียนที่ มหาวิทยาลัยกลับบ์ดับดริบ และการตัดสินใจรับเข้าเรียนมีดังนี้
ตารางที่ 1 ผู้สมัครจากลิลิพุต (90% มีคุณสมบัติ)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 3 |
ถูกปฏิเสธ | 45 | 7 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 7/10 = 70% เปอร์เซ็นต์รวมของนักเรียนชาวลิลิพุตที่ได้รับการตอบรับ: (45+3)/100 = 48% |
ตารางที่ 2 ผู้สมัครจาก Brobdingnag (10% มีคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 9 |
ถูกปฏิเสธ | 5 | 81 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 81/90 = 90% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่ได้รับการตอบรับ: (5+9)/100 = 14% |
ตัวอย่างข้างต้นเป็นไปตามความเท่าเทียมกันในโอกาสที่จะได้รับการยอมรับ ของนักเรียน/นักศึกษาที่มีคุณสมบัติเหมาะสม เนื่องจากทั้งชาวลิลิพุตและชาวบร็อบดิงแนก มีโอกาส 50% ที่จะได้รับการตอบรับ
แม้ว่าโอกาสจะเท่าเทียมกัน แต่เมตริกความเป็นธรรม 2 รายการต่อไปนี้ ยังไม่เป็นไปตามข้อกำหนด
- ความเท่าเทียมกันทางประชากรศาสตร์: ชาวลิลิพุตและชาวบร็อบดิงแนกจะได้รับการตอบรับเข้ามหาวิทยาลัยในอัตราที่แตกต่างกัน โดยนักเรียนชาวลิลิพุตได้รับการตอบรับ 48% แต่นักเรียนชาวบร็อบดิงแนกได้รับการตอบรับเพียง 14%
- โอกาสที่เท่าเทียมกัน: แม้ว่านักเรียน/นักศึกษาชาวลิลิพุต และชาวบร็อบดิงแนกที่มีคุณสมบัติเหมาะสมจะมีโอกาสได้รับการตอบรับเท่ากัน แต่ข้อจำกัดเพิ่มเติมที่ว่านักเรียน/นักศึกษาชาวลิลิพุตและ ชาวบร็อบดิงแนกที่ไม่มีคุณสมบัติเหมาะสมจะมีโอกาสถูกปฏิเสธเท่ากันนั้นไม่เป็นจริง ชาวลิลิปุตที่ไม่ผ่านเกณฑ์มีอัตราการปฏิเสธ 70% ส่วนชาวบร็อบดิงแน็กที่ไม่ผ่านเกณฑ์มีอัตราการปฏิเสธ 90%
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ความเท่าเทียมกันของ โอกาส ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง
โอกาสที่เท่ากัน
เมตริกความเป็นธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ได้ดีเท่ากันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่ละเอียดอ่อนหรือไม่ โดยคำนึงถึงทั้งคลาสบวกและคลาสลบ ไม่ใช่แค่คลาสใดคลาสหนึ่งเท่านั้น กล่าวคือ อัตราผลบวกจริง และอัตราผลลบลวงควรเท่ากันสำหรับ ทุกกลุ่ม
โอกาสที่เท่าเทียมกันเกี่ยวข้องกับความเท่าเทียมกันของโอกาส ซึ่งมุ่งเน้นเฉพาะ อัตราข้อผิดพลาดสำหรับคลาสเดียว (บวกหรือลบ)
ตัวอย่างเช่น สมมติว่ามหาวิทยาลัยกลับดับดริบรับทั้งชาวลิลิพุตและชาวบร็อบดิงแนกเข้าเรียนในหลักสูตรคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมของชาวลิลิพุต มีหลักสูตรที่แข็งแกร่งสำหรับชั้นเรียนคณิตศาสตร์ และนักเรียนส่วนใหญ่ มีคุณสมบัติเหมาะสมสำหรับโปรแกรมมหาวิทยาลัย โรงเรียนมัธยมของชาวบร็อบดิงแนกไม่มีชั้นเรียนคณิตศาสตร์เลย และด้วยเหตุนี้ นักเรียนจำนวนน้อยมากจึงมีคุณสมบัติเหมาะสม ความน่าจะเป็นที่เท่ากันจะเกิดขึ้นได้ก็ต่อเมื่อไม่ว่าผู้สมัครจะเป็นชาวลิลิปุตหรือชาวบร็อบดิงแน็ก หากมีคุณสมบัติครบถ้วน ก็มีโอกาสได้รับการยอมรับให้เข้าร่วมโปรแกรมเท่ากัน และหากไม่มีคุณสมบัติครบถ้วน ก็มีโอกาสถูกปฏิเสธเท่ากัน
สมมติว่าชาวลิลิปุต 100 คนและชาวบร็อบดิงแน็ก 100 คนสมัครเข้ามหาวิทยาลัยกลับบ์ดับดริบ และมีการตัดสินใจรับเข้าเรียนดังนี้
ตารางที่ 3 ผู้สมัครจากลิลิพุต (90% มีคุณสมบัติ)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 2 |
ถูกปฏิเสธ | 45 | 8 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติผ่านที่ได้รับการตอบรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติผ่านที่ถูกปฏิเสธ: 8/10 = 80% เปอร์เซ็นต์รวมของนักเรียนชาวลิลิพุตที่ได้รับการตอบรับ: (45+2)/100 = 47% |
ตารางที่ 4 ผู้สมัครจาก Brobdingnag (10% มีคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 18 |
ถูกปฏิเสธ | 5 | 72 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 72/90 = 80% เปอร์เซ็นต์รวมของนักเรียนจาก Brobdingnag ที่ได้รับการตอบรับ: (5+18)/100 = 23% |
โอกาสที่เท่าเทียมกันเป็นไปตามเงื่อนไขเนื่องจากนักเรียนที่มีคุณสมบัติทั้งชาวลิลิพุตและชาวบร็อบดิงแนก มีโอกาส 50% ที่จะได้รับการตอบรับ และชาวลิลิพุต และชาวบร็อบดิงแนกที่ไม่มีคุณสมบัติมีโอกาส 80% ที่จะถูกปฏิเสธ
ความน่าจะเป็นที่เท่ากันมีการกำหนดอย่างเป็นทางการใน "ความเท่าเทียมของ โอกาสในการเรียนรู้ภายใต้การกำกับดูแล" ดังนี้ "ตัวทำนาย Ŷ มีความน่าจะเป็นที่เท่ากันเมื่อเทียบกับ แอตทริบิวต์ที่ได้รับการคุ้มครอง A และผลลัพธ์ Y หาก Ŷ และ A เป็นอิสระ โดยมีเงื่อนไขเป็น Y"
อคติของผู้ทดลอง
F
ข้อจำกัดด้านความเป็นธรรม
การใช้ข้อจำกัดกับอัลกอริทึมเพื่อให้มั่นใจว่าคำจำกัดความของความเป็นธรรมอย่างน้อย 1 รายการเป็นไปตามข้อกำหนด ตัวอย่างข้อจำกัดด้านความเป็นธรรม ได้แก่- การประมวลผลภายหลังเอาต์พุตของโมเดล
- การแก้ไขฟังก์ชันการสูญเสียเพื่อรวมค่าปรับ สำหรับการละเมิดเมตริกความเป็นธรรม
- การเพิ่มข้อจํากัดทางคณิตศาสตร์ลงในปัญหาการเพิ่มประสิทธิภาพโดยตรง
เมตริกความเป็นธรรม
คำจำกัดความทางคณิตศาสตร์ของ "ความเป็นธรรม" ที่วัดได้ ตัวอย่างเมตริกความเป็นธรรมที่ใช้กันโดยทั่วไปมีดังนี้
- โอกาสที่เท่าเทียม
- ความเท่าเทียมในการคาดการณ์
- ความเป็นธรรมแบบข้อเท็จจริง
- ความเท่าเทียมกันของข้อมูลประชากร
เมตริกความเป็นธรรมหลายรายการไม่สามารถใช้ร่วมกันได้ โปรดดูความไม่เข้ากันของเมตริกความเป็นธรรม
G
อคติในการระบุแหล่งที่มาของกลุ่ม
การสันนิษฐานว่าสิ่งที่จริงสำหรับบุคคลหนึ่งก็จริงสำหรับทุกคน ในกลุ่มนั้นด้วย อคติในการระบุแหล่งที่มาของกลุ่มอาจรุนแรงขึ้น หากใช้การสุ่มตัวอย่างตามความสะดวก ในการเก็บรวบรวมข้อมูล ในกลุ่มตัวอย่างที่ไม่เป็นตัวแทน ระบบอาจทําการระบุแหล่งที่มา ซึ่งไม่ตรงกับความเป็นจริง
ดูอคติความเหมือนกันของกลุ่มนอก และอคติในกลุ่มด้วย นอกจากนี้ โปรดดูข้อมูลเพิ่มเติมในความเป็นธรรม: ประเภทของอคติ ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง
H
อคติทางประวัติศาสตร์
อคติประเภทหนึ่งที่มีอยู่แล้วในโลกและแทรกซึมเข้าไปในชุดข้อมูล อคติเหล่านี้มักจะสะท้อนถึง การเหมารวมทางวัฒนธรรมที่มีอยู่ ความไม่เท่าเทียมกันทางประชากร และอคติที่มีต่อกลุ่ม ทางสังคมบางกลุ่ม
ตัวอย่างเช่น ลองพิจารณาโมเดลการจัดประเภทที่ คาดการณ์ว่าผู้สมัครขอสินเชื่อจะผิดนัดชำระหนี้หรือไม่ ซึ่งได้รับการ ฝึกจากข้อมูลการผิดนัดชำระหนี้ย้อนหลังตั้งแต่ปี 1980 จากธนาคารท้องถิ่นใน 2 ชุมชนที่แตกต่างกัน หากผู้สมัครจากชุมชน ก ในอดีตมีแนวโน้มที่จะผิดนัดชำระหนี้มากกว่าผู้สมัครจากชุมชน ข ถึง 6 เท่า โมเดลอาจเรียนรู้จากอคติในอดีต ซึ่งส่งผลให้โมเดลมีแนวโน้มน้อยที่จะอนุมัติเงินกู้ในชุมชน ก แม้ว่าเงื่อนไขในอดีตที่ส่งผลให้อัตราการผิดนัดชำระหนี้ในชุมชนนั้นสูงขึ้นจะไม่มีความเกี่ยวข้องอีกต่อไปก็ตาม
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของ อคติ ในหลักสูตรเร่งรัดแมชชีนเลิร์นนิง
I
อคติโดยไม่รู้ตัว
การเชื่อมโยงหรือการคาดเดาโดยอัตโนมัติตามโมเดลความคิดและความทรงจำของบุคคล อคติแฝงอาจส่งผลต่อสิ่งต่อไปนี้
- วิธีเก็บรวบรวมและจัดประเภทข้อมูล
- วิธีออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง
ตัวอย่างเช่น เมื่อสร้างโมเดลการจัดประเภท เพื่อระบุรูปภาพงานแต่งงาน วิศวกรอาจใช้การมีชุดสีขาว ในรูปภาพเป็นฟีเจอร์ อย่างไรก็ตาม ชุดสีขาวเป็นธรรมเนียมเฉพาะในบางยุคและบางวัฒนธรรมเท่านั้น
ดูอคติยืนยันความคิดตัวเองด้วย
ความไม่เข้ากันของเมตริกความเป็นธรรม
แนวคิดที่ว่าแนวคิดเรื่องความยุติธรรมบางอย่างใช้ร่วมกันไม่ได้และ ไม่สามารถตอบสนองพร้อมกันได้ ด้วยเหตุนี้ จึงไม่มีเมตริกเดียวที่ใช้ได้ทั่วไป ในการวัดความเป็นธรรม ซึ่งนำไปใช้กับปัญหา ML ทั้งหมดได้
แม้ว่าอาจดูเหมือนว่าการวัดความยุติธรรมไม่สอดคล้องกัน ไม่ได้หมายความว่าความพยายามที่จะสร้างความยุติธรรมนั้นไร้ผล แต่กลับแนะนำว่า ต้องกำหนดความเป็นธรรมตามบริบทสำหรับปัญหา ML ที่กำหนด โดยมี เป้าหมายเพื่อป้องกันอันตรายที่เฉพาะเจาะจงกับ Use Case ของปัญหา
ดูรายละเอียดเพิ่มเติมเกี่ยวกับการไม่สามารถใช้เมตริกความเป็นธรรมร่วมกันได้ที่ "On the (im)possibility of fairness"
ความเป็นธรรมต่อบุคคล
เมตริกความเป็นธรรมที่ตรวจสอบว่าบุคคลที่คล้ายกันได้รับการจัดประเภท ในลักษณะเดียวกันหรือไม่ ตัวอย่างเช่น Brobdingnagian Academy อาจต้องการสร้างความเท่าเทียมกันในระดับบุคคลโดยการรับประกันว่านักเรียน 2 คนที่มีคะแนนเหมือนกันและคะแนนสอบมาตรฐานมีโอกาสเท่ากันที่จะได้รับการตอบรับ
โปรดทราบว่าความเป็นธรรมในระดับบุคคลขึ้นอยู่กับวิธีที่คุณกำหนด "ความคล้ายคลึง" (ในกรณีนี้คือเกรดและคะแนนสอบ) และคุณอาจเสี่ยงต่อการ ทำให้เกิดปัญหาด้านความเป็นธรรมใหม่ๆ หากเมตริกความคล้ายคลึงพลาดข้อมูลสำคัญ (เช่น ความเข้มงวดของหลักสูตรของนักเรียน)
ดูรายละเอียดเพิ่มเติมเกี่ยวกับการพิจารณาความเป็นธรรมในแต่ละบุคคลได้ที่ "ความเป็นธรรมผ่านการรับรู้"
อคติในกลุ่ม
การแสดงความลำเอียงต่อกลุ่มหรือลักษณะของตนเอง หากผู้ทดสอบหรือผู้ให้คะแนนเป็นเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาแมชชีนเลิร์นนิง อคติในกลุ่มอาจทำให้การทดสอบผลิตภัณฑ์ หรือชุดข้อมูลไม่ถูกต้อง
อคติในกลุ่มเป็นรูปแบบหนึ่งของอคติในการระบุแหล่งที่มาของกลุ่ม ดูอคติความเหมือนกันของกลุ่มนอกด้วย
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติใน หลักสูตรเร่งรัดแมชชีนเลิร์นนิง
N
อคติจากการไม่ตอบ
O
อคติความเหมือนกันของกลุ่มนอก
แนวโน้มที่จะมองว่าสมาชิกนอกกลุ่มมีความคล้ายคลึงกันมากกว่าสมาชิกในกลุ่ม เมื่อเปรียบเทียบทัศนคติ คุณค่า ลักษณะบุคลิกภาพ และลักษณะอื่นๆ กลุ่มในหมายถึงผู้ที่คุณโต้ตอบด้วยเป็นประจำ กลุ่มนอกหมายถึงผู้ที่คุณไม่ได้โต้ตอบด้วยเป็นประจำ หากคุณ สร้างชุดข้อมูลโดยขอให้ผู้คนระบุแอตทริบิวต์เกี่ยวกับ กลุ่มนอก แอตทริบิวต์เหล่านั้นอาจมีความแตกต่างน้อยกว่าและเป็นแบบเหมารวมมากกว่า แอตทริบิวต์ที่ผู้เข้าร่วมระบุสำหรับผู้คนในกลุ่มของตน
ตัวอย่างเช่น ชาวลิลิพุตอาจอธิบายบ้านของชาวลิลิพุตคนอื่นๆ อย่างละเอียด โดยอ้างถึงความแตกต่างเล็กๆ น้อยๆ ในรูปแบบสถาปัตยกรรม หน้าต่าง ประตู และขนาด แต่ชาวลิลิปุตคนเดียวกันนี้อาจกล่าวว่า ชาวบร็อบดิงแน็กทุกคนอาศัยอยู่ในบ้านที่เหมือนกัน
อคติความเหมือนกันของกลุ่มนอกเป็นรูปแบบหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม
ดูอคติในกลุ่มด้วย
P
อคติจากการเข้าร่วม
คำพ้องความหมายของอคติจากการไม่ตอบ ดูอคติในการเลือก
หลังการประมวลผล
การปรับเอาต์พุตของโมเดลหลังจากเรียกใช้โมเดลแล้ว การประมวลผลภายหลังสามารถใช้เพื่อบังคับใช้ข้อจํากัดด้านความเป็นธรรมโดยไม่ต้อง แก้ไขโมเดลด้วยตนเอง
ตัวอย่างเช่น อาจใช้การประมวลผลภายหลังกับโมเดลการจัดประเภทแบบไบนารีโดยการตั้งค่าเกณฑ์การจัดประเภทเพื่อให้ความเท่าเทียมกันของโอกาสยังคงอยู่ สําหรับแอตทริบิวต์บางอย่างโดยตรวจสอบว่าอัตราผลบวกจริง มีค่าเท่ากันสําหรับค่าทั้งหมดของแอตทริบิวต์นั้น
ความเท่าเทียมในการคาดการณ์
เมตริกความเป็นธรรมที่ตรวจสอบว่าสำหรับโมเดลการแยกประเภทที่กำหนด อัตราความแม่นยำเทียบเท่ากับกลุ่มย่อยที่พิจารณาหรือไม่
ตัวอย่างเช่น โมเดลที่คาดการณ์การตอบรับเข้าวิทยาลัยจะตรงตาม ความเท่าเทียมเชิงคาดการณ์สำหรับสัญชาติ หากอัตราความแม่นยำเท่ากัน สำหรับชาวลิลิปุตและชาวโบรบดิงแนก
บางครั้งเราเรียกความเท่าเทียมในการคาดการณ์ว่าความเท่าเทียมของอัตราการคาดการณ์
ดูรายละเอียดเพิ่มเติมเกี่ยวกับการเท่าเทียมในการคาดการณ์ได้ที่ "คำอธิบายคำจำกัดความของความเป็นธรรม" (ส่วนที่ 3.2.1)
ความเท่าเทียมของราคาเชิงคาดการณ์
อีกชื่อหนึ่งของความเท่าเทียมเชิงคาดการณ์
การประมวลผลล่วงหน้า
การประมวลผลข้อมูลก่อนที่จะนำไปใช้ฝึกโมเดล การประมวลผลล่วงหน้าอาจ ง่ายๆ เพียงแค่การนำคำออกจากคลังข้อความภาษาอังกฤษที่ไม่ได้ อยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจซับซ้อนถึงขั้นการแสดง จุดข้อมูลใหม่ในลักษณะที่กำจัดแอตทริบิวต์ที่สัมพันธ์กับแอตทริบิวต์ที่ละเอียดอ่อนให้ได้มากที่สุด การประมวลผลล่วงหน้าช่วยให้เป็นไปตามข้อจํากัดด้านความเป็นธรรมได้พร็อกซี (แอตทริบิวต์ที่ละเอียดอ่อน)
แอตทริบิวต์ที่ใช้แทนแอตทริบิวต์ที่ละเอียดอ่อน เช่น รหัสไปรษณีย์ของบุคคลอาจใช้เป็นตัวแทนของรายได้ เชื้อชาติ หรือกลุ่มชาติพันธุ์R
อคติในการรายงาน
ความถี่ที่ผู้คนเขียนถึงการกระทำ ผลลัพธ์ หรือพร็อพเพอร์ตี้ไม่ได้สะท้อนถึงความถี่ในโลกแห่งความเป็นจริงหรือระดับที่พร็อพเพอร์ตี้เป็นลักษณะเฉพาะของกลุ่มบุคคล อคติในการรายงานอาจส่งผลต่อองค์ประกอบ ของข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้
เช่น ในหนังสือ คำว่าหัวเราะพบได้บ่อยกว่าคำว่าหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่สัมพัทธ์ของ การหัวเราะและการหายใจจากคลังหนังสืออาจระบุว่า การหัวเราะพบได้บ่อยกว่าการหายใจ
ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติ ในหลักสูตรเร่งรัดแมชชีนเลิร์นนิง
S
อคติในการสุ่มตัวอย่าง
อคติในการเลือก
ข้อผิดพลาดในข้อสรุปที่ได้จากข้อมูลที่สุ่มตัวอย่างเนื่องจากกระบวนการเลือก ที่สร้างความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตได้ในข้อมูล กับตัวอย่างที่สังเกตไม่ได้ อคติในการเลือกมีรูปแบบดังนี้
- อคติจากความครอบคลุม: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับประชากรที่โมเดลแมชชีนเลิร์นนิงใช้คาดการณ์
- อคติในการสุ่มตัวอย่าง: ไม่ได้รวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
- อคติจากการไม่ตอบ (หรือที่เรียกว่าอคติจากการเข้าร่วม): ผู้ใช้จาก บางกลุ่มเลือกไม่เข้าร่วมตอบแบบสำรวจในอัตราที่แตกต่างจากผู้ใช้จาก กลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าคุณกำลังสร้างโมเดลแมชชีนเลิร์นนิงที่คาดการณ์ ความชอบภาพยนตร์ของผู้คน หากต้องการรวบรวมข้อมูลการฝึก คุณจะแจกแบบสำรวจให้ทุกคนที่นั่งแถวหน้าในโรงภาพยนตร์ ที่ฉายภาพยนตร์ ในแง่หนึ่ง วิธีนี้อาจดูเหมือนเป็นวิธีที่สมเหตุสมผลในการรวบรวมชุดข้อมูล แต่การเก็บรวบรวมข้อมูลในรูปแบบนี้อาจทำให้เกิดอคติในการเลือกในรูปแบบต่อไปนี้
- อคติในการครอบคลุม: การสุ่มตัวอย่างจากประชากรที่เลือกดูภาพยนตร์อาจทำให้การคาดการณ์ของโมเดลไม่สามารถสรุปผลไปยังผู้ที่ไม่ได้แสดงความสนใจในภาพยนตร์ในระดับนั้นได้
- อคติในการสุ่มตัวอย่าง: แทนที่จะสุ่มตัวอย่างจากประชากรเป้าหมาย (ทุกคนที่อยู่ในโรงภาพยนตร์) คุณกลับสุ่มตัวอย่างเฉพาะคนที่นั่งแถวหน้า เป็นไปได้ว่าผู้ที่นั่งแถวหน้าจะสนใจภาพยนตร์มากกว่าผู้ที่นั่งแถวอื่นๆ
- อคติจากการไม่ตอบ: โดยทั่วไปแล้ว ผู้ที่มีความคิดเห็นอย่างชัดเจนมักจะตอบแบบสำรวจที่ไม่บังคับบ่อยกว่าผู้ที่มีความคิดเห็นแบบกลางๆ เนื่องจากแบบสำรวจภาพยนตร์เป็นแบบไม่บังคับ คำตอบจึงมีแนวโน้มที่จะสร้างการกระจายแบบ 2 โหมดมากกว่าการกระจายแบบปกติ (รูประฆัง)
แอตทริบิวต์ที่มีความละเอียดอ่อน
คุณลักษณะของมนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษด้วยเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนบุคคลU
การไม่รับรู้ (ต่อแอตทริบิวต์ที่มีความละเอียดอ่อน)
สถานการณ์ที่แอตทริบิวต์ที่ละเอียดอ่อนมีอยู่ แต่ไม่ได้รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่ละเอียดอ่อน มักจะมีความสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูล โมเดลที่ได้รับการฝึก โดยไม่ทราบเกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนจึงอาจยังคงมีผลกระทบที่ไม่เท่าเทียมกันเกี่ยวกับแอตทริบิวต์นั้น หรือละเมิดข้อจํากัดด้านความเป็นธรรมอื่นๆ