หน้านี้มีคำศัพท์เกี่ยวกับความเป็นธรรม หากต้องการดูคำศัพท์ในอภิธานศัพท์ทั้งหมด คลิกที่นี่
A
แอตทริบิวต์
คำพ้องความหมายของ feature
ในความเป็นธรรมของแมชชีนเลิร์นนิง แอตทริบิวต์มักจะหมายถึงลักษณะเฉพาะที่เกี่ยวข้องกับบุคคล
อคติการทำงานอัตโนมัติ
เมื่อผู้มีอำนาจตัดสินใจชอบคำแนะนำจากระบบการตัดสินใจอัตโนมัติมากกว่าข้อมูลที่ไม่มีการทำงานอัตโนมัติ แม้ว่าระบบการตัดสินใจอัตโนมัติจะเกิดข้อผิดพลาดก็ตาม
B
อคติ (จริยธรรม/ความเป็นธรรม)
1. การเหมารวม อคติ หรือรายการโปรดกับบางสิ่ง บุคคล หรือกลุ่มบุคคลมากกว่าผู้อื่น อคติเหล่านี้อาจส่งผลต่อการรวบรวมและการตีความข้อมูล การออกแบบระบบ และวิธีที่ผู้ใช้โต้ตอบกับระบบ รูปแบบของการให้น้ำหนักพิเศษประเภทนี้ได้แก่
- การให้น้ำหนักพิเศษในการทำงานอัตโนมัติ
- การให้น้ำหนักพิเศษในการยืนยัน
- อคติของผู้ทดสอบ
- ความลำเอียงในการระบุแหล่งที่มาของกลุ่ม
- อคติโดยไม่รู้ตัว
- ความลำเอียงในกลุ่ม
- อคติจากความเป็นเอกพันธ์ภายนอกกลุ่ม
2. ข้อผิดพลาดอย่างเป็นระบบซึ่งเกิดขึ้นจากขั้นตอนการสุ่มตัวอย่างหรือการรายงาน รูปแบบของการให้น้ำหนักพิเศษประเภทนี้ได้แก่
- การให้น้ำหนักพิเศษกับความครอบคลุม
- ความลำเอียงแบบไม่ตอบ
- อคติในการเข้าร่วม
- ความลำเอียงในการรายงาน
- การให้น้ำหนักพิเศษในการสุ่มตัวอย่าง
- ความเอนเอียงในการเลือก
อย่าสับสนกับคำศัพท์ที่มีอคติในโมเดลแมชชีนเลิร์นนิงหรืออคติของการคาดการณ์
C
อคติยืนยันความคิดตัวเอง
แนวโน้มในการค้นหา ตีความ สนับสนุน และการเรียกคืนข้อมูลในลักษณะที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ก่อนแล้ว นักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิงอาจรวบรวมหรือติดป้ายกำกับข้อมูลในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่โดยไม่ได้ตั้งใจ อคติยืนยันเป็นรูปแบบหนึ่งของการให้น้ำหนักพิเศษโดยปริยาย
อคติของผู้ทดสอบเป็นรูปแบบของอคติการยืนยันที่ผู้ทดสอบฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่ก่อน
ความยุติธรรมที่พิสูจน์ได้จริง
เมตริกความยุติธรรมที่ตรวจสอบว่าตัวแยกประเภทสร้างผลลัพธ์ให้กับบุคคลรายหนึ่งเช่นเดียวกับอีกบุคคลหนึ่งที่เหมือนกับบุคคลแรกหรือไม่ ยกเว้นกรณีที่เกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินตัวแยกประเภทเพื่อความเป็นธรรมที่โต้แย้งความจริงเป็นวิธีการหนึ่งในการแสดงแหล่งอคติที่อาจเกิดขึ้นในโมเดล
ดู "When Worlds Collide: Integrating Different Different Counterf true Assumptions in Fairness" สำหรับการอภิปรายอย่างละเอียดเกี่ยวกับความเป็นธรรมที่โต้แย้งกัน
อคติเรื่องความครอบคลุม
ดูการให้น้ำหนักพิเศษในการเลือก
D
ความเท่าเทียมกันของข้อมูลประชากร
เมตริกความยุติธรรมที่จะพึงพอใจหากผลลัพธ์การจัดประเภทของโมเดลไม่ขึ้นอยู่กับแอตทริบิวต์ที่มีความละเอียดอ่อนที่ระบุ
ตัวอย่างเช่น ถ้าทั้ง Lilliputians และ Brobdingnagians สมัครเข้ามหาวิทยาลัย Glubbdubdrib จะมีความเท่าเทียมของข้อมูลประชากรหากเปอร์เซ็นต์ของ Lilliputians ที่เข้าสอบมีค่าเท่ากับเปอร์เซ็นต์ของ Brobdingnagians ที่เข้าเรียน ไม่ว่าโดยเฉลี่ยแล้วกลุ่มใดจะมีคุณสมบัติมากกว่ากลุ่มอื่น
ตรงข้ามกับความน่าจะเป็นที่เท่ากันและความเท่าเทียมกันของโอกาส ซึ่งทําให้การแยกประเภทผลลัพธ์แบบรวมขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน แต่ไม่อนุญาตให้ผลการแยกประเภทสําหรับป้ายกํากับข้อมูลที่ได้จากการสังเกตการณ์ที่ระบุบางรายการขึ้นอยู่กับแอตทริบิวต์ที่มีความละเอียดอ่อน ดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น" สำหรับภาพที่แสดงข้อดีและข้อเสียต่างๆ เมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมของข้อมูลประชากร
ผลกระทบที่แตกต่างกัน
การตัดสินใจเกี่ยวกับผู้คนที่ส่งผลกระทบต่อ ประชากรกลุ่มต่างๆ ในสัดส่วนที่มากกว่า ซึ่งมักจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจของอัลกอริทึมส่งผลเสียหรือให้ประโยชน์แก่กลุ่มย่อยบางกลุ่มมากกว่ากลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่กำหนดการมีสิทธิ์ของ Lilliputian สำหรับสินเชื่อบ้านขนาดเล็กมีแนวโน้มที่จะจัดว่า "ไม่มีสิทธิ์" มากกว่าในกรณีที่ที่อยู่จัดส่งมีรหัสไปรษณีย์เฉพาะ หาก Lilliputian ซึ่งเป็นชาวบิ๊กเอนด์มีแนวโน้มที่จะมีที่อยู่ทางไปรษณีย์ที่มีรหัสไปรษณีย์นี้มากกว่า Lilliputians ของ Little-Endian อัลกอริทึมนี้อาจส่งผลกระทบที่แตกต่างกัน
ซึ่งตรงข้ามกับการปฏิบัติที่แตกต่างกัน ซึ่งมุ่งเน้นที่ความไม่สอดคล้องที่เกิดขึ้นเมื่อลักษณะของกลุ่มย่อยเป็นข้อมูลป้อนเข้าในกระบวนการตัดสินใจแบบอัลกอริทึมอย่างชัดเจน
การปฏิบัติที่แตกต่างกัน
การคำนึงถึงคุณลักษณะที่มีความละเอียดอ่อนของผู้ที่อยู่ในกระบวนการตัดสินใจตามอัลกอริทึมเพื่อทำให้กลุ่มย่อยของกลุ่มคนต่างๆ ได้รับการปฏิบัติไม่เหมือนกัน
เช่น ลองพิจารณาอัลกอริทึมที่กำหนดการมีสิทธิ์ของ Lilliputians สำหรับสินเชื่อบ้านขนาดเล็กตามข้อมูลที่ให้ไว้ในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้การเชื่อมโยงของ Liliputian ในชื่อ Big-Endian หรือ Little-Endian เป็นอินพุต ก็จะเป็นการแสดงการปฏิบัติที่แตกต่างกันตามมิติข้อมูลนั้น
ตรงข้ามกับผลกระทบที่แตกต่างกัน ซึ่งมุ่งเน้นที่ความไม่เท่าเทียมในผลกระทบทางสังคมของการตัดสินใจทางอัลกอริทึมที่มีต่อกลุ่มย่อย ไม่ว่ากลุ่มย่อยเหล่านั้นจะเป็นอินพุตของโมเดลหรือไม่ก็ตาม
จ.
ความเท่าเทียมของโอกาส
เมตริกความยุติธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ที่ต้องการได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่มีความละเอียดอ่อนหรือไม่ กล่าวคือ หากผลลัพธ์ที่ต้องการสำหรับโมเดลคือคลาสเชิงบวก เป้าหมายก็จะให้อัตราผลบวกจริงเหมือนกันสำหรับทุกกลุ่ม
ความเท่าเทียมของโอกาสเกี่ยวข้องกับความน่าจะเป็นที่เท่าเทียมกัน ซึ่งกําหนดให้ทั้งอัตราผลบวกจริงและอัตราผลบวกลวงต้องเหมือนกันในทุกกลุ่ม
สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians เข้าเรียนในโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาของ Lilliputians มีชั้นเรียนคณิตศาสตร์ที่มีประสิทธิภาพและนักเรียนส่วนใหญ่มีคุณสมบัติเข้าเรียนโปรแกรมของมหาวิทยาลัย โรงเรียนมัธยมศึกษาของ Brobdingnagians จึงไม่มีชั้นเรียนคณิตศาสตร์เลย จึงทำให้ไม่มีนักเรียนที่มีคุณสมบัติเพียงพอ ความเท่าเทียมกันของโอกาสคือระดับซึ่งสอดคล้องกับป้ายกำกับที่ต้องการเป็น "ยอมรับ" ในส่วนที่เกี่ยวกับสัญชาติ (Lilliputian หรือ Brobdingnagian) หากนักเรียนที่มีคุณสมบัติตามเกณฑ์มีแนวโน้มที่จะรับเข้าศึกษาได้เท่ากันไม่ว่านักเรียนจะเป็น Lilliputian หรือ Brobdingnagian
ตัวอย่างเช่น สมมติว่าชาวลิลลิปูชัน 100 คนและบรอบดิงนาเจียน 100 คนสมัครเข้ามหาวิทยาลัย Glubbdubdrib และตัดสินใจรับสมัครนักศึกษาดังนี้
ตารางที่ 1 ผู้สมัคร Lilliputian (90% มีคุณสมบัติครบถ้วน)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 3 |
ปฏิเสธแล้ว | 45 | 7 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติที่ถูกปฏิเสธ: 7/10 = 70% เปอร์เซ็นต์รวมของนักเรียน Lilliputian ที่รับเข้าศึกษาคือ (45+3)/100 = 48% |
ตารางที่ 2 ผู้สมัคร Brobdingnagian (10% มีคุณสมบัติครบถ้วน):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 9 |
ปฏิเสธแล้ว | 5 | 81 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองที่ถูกปฏิเสธ: 81/90 = 90% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่รับเข้าศึกษา: (5+9)/100 = 14% |
ตัวอย่างก่อนหน้านี้แสดงให้เห็นถึงความเท่าเทียมของโอกาสในการยอมรับนักเรียนที่มีคุณสมบัติเหมาะสม เนื่องจากทั้ง Lilliputians และ Brobdingnagians ที่มีคุณสมบัติเหมาะสมมีโอกาส 50% ที่จะได้เข้าศึกษา
แม้เราจะพึงพอใจเท่าๆ กัน แต่เมตริกด้านความเป็นธรรม 2 ประการต่อไปนี้ไม่ได้รับการตอบสนอง
- ความเท่าเทียมกันของข้อมูลประชากร: Lilliputian และ Brobdingnagians เข้ามหาวิทยาลัยในอัตราที่แตกต่างกัน โดย 48% ของนักเรียน Lilliputian ได้รับเข้าศึกษา แต่มีเพียง 14% ของนักศึกษา Brobdingnagian ที่เข้ามหาวิทยาลัย
- โอกาสในการเข้าเรียนที่เท่าเทียมกัน: แม้ว่านักเรียนจาก Lilliputian และ Brobdingnagian ที่มีคุณสมบัติเหมาะสมจะได้รับโอกาสเข้ารับการศึกษาเหมือนกัน แต่ข้อจำกัดเพิ่มเติมที่นักเรียน Lilliputian และ Brobdingnagians ไม่ผ่านการรับรองมีโอกาสที่ถูกปฏิเสธเท่ากัน Lilliputian ที่ไม่มีคุณสมบัติมีอัตราการปฏิเสธ 70% ขณะที่ Brobdingnagians ที่ไม่เข้าเกณฑ์มีอัตราการปฏิเสธ 90%
ดู "ความเท่าเทียมของโอกาสในการเรียนรู้ที่มีการควบคุมดูแล" เพื่อดูรายละเอียดเพิ่มเติมเกี่ยวกับความเท่าเทียมของโอกาส นอกจากนี้ โปรดดู "การโจมตี การเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น" สำหรับภาพที่แสดงข้อดีและข้อเสียต่างๆ เมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมของโอกาส
ความน่าจะเป็นที่เท่ากัน
เมตริกความยุติธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่มีความละเอียดอ่อน โดยเคารพทั้งคลาสเชิงบวกและคลาสเชิงลบ ไม่ใช่แค่คลาสใดคลาสหนึ่งหรือคลาสอื่นๆ โดยเฉพาะ กล่าวคือ ทั้งอัตราผลบวกจริงและอัตราผลบวกลวงควรเหมือนกันสำหรับทุกกลุ่ม
ความน่าจะเป็นที่เท่าเทียมกันจะเกี่ยวข้องกับความเท่าเทียมกันของโอกาส ซึ่งมุ่งเน้นที่อัตราข้อผิดพลาดเพียงคลาสเดียว (เชิงบวกหรือเชิงลบ)
ตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians เข้าเรียนในโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาของ Lilliputians มีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพและนักเรียนส่วนใหญ่มีคุณสมบัติสำหรับโปรแกรมของมหาวิทยาลัย โรงเรียนมัธยมศึกษาของ Brobdingnagians จึงไม่มีชั้นเรียนคณิตศาสตร์เลย จึงทำให้ไม่มีนักเรียนที่มีคุณสมบัติมากนัก ผู้สมัครได้รับเลือกให้มีโอกาสได้รับความพึงพอใจอย่างเท่าเทียมกันโดยมีเงื่อนไขว่าผู้สมัครเป็น Lilliputian หรือ Brobdingnagian ได้หากมีคุณสมบัติครบถ้วน ผู้สมัครก็มีแนวโน้มที่จะได้รับเลือกเข้าร่วมโปรแกรมได้ในระดับเดียวกัน และหากไม่มีสิทธิ์ ผู้สมัครก็มีแนวโน้มที่จะถูกปฏิเสธไม่แพ้กัน
สมมติว่ามีนักศึกษา Lilliputian 100 คนและ Brobdingnagians อีก 100 คนสมัครเข้าร่วมมหาวิทยาลัย Glubbdubdrib และตัดสินใจเรื่องการรับนักศึกษาดังนี้
ตารางที่ 3 ผู้สมัคร Lilliputian (90% มีคุณสมบัติครบถ้วน)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 2 |
ปฏิเสธแล้ว | 45 | 8 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติที่ถูกปฏิเสธ: 8/10 = 80% เปอร์เซ็นต์รวมของนักเรียน Lilliputian ที่รับเข้าศึกษา: (45+2)/100 = 47% |
ตารางที่ 4 ผู้สมัคร Brobdingnagian (10% มีคุณสมบัติครบถ้วน):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 18 |
ปฏิเสธแล้ว | 5 | 72 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติซึ่งถูกปฏิเสธ: 72/90 = 80% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่รับเข้าศึกษา: (5+18)/100 = 23% |
คำตอบที่เท่าเทียมกันนั้นพึงพอใจเพราะนักเรียนของ Lilliputian และ Brobdingnagian ที่มีคุณสมบัติตามเกณฑ์มีโอกาสได้รับเลือกให้เข้าศึกษาถึง 50% และ Lilliputian และ Brobdingnagian ที่ขาดคุณสมบัติมีโอกาสจะถูกปฏิเสธ 80%
ความน่าจะเป็นแบบเท่ากันมีคำจำกัดความอย่างเป็นทางการไว้ใน "ความเท่าเทียมของโอกาสในการเรียนรู้ภายใต้การควบคุมดูแล" ดังนี้ "ผู้คาดการณ์ เริ่มต้นด้วยความเป็นไปได้ที่เท่ากันซึ่งเกี่ยวข้องกับแอตทริบิวต์ A และผลลัพธ์ Y หาก บัญญัติ และ A เป็นอิสระ โดยมีเงื่อนไขบน Y"
อคติของผู้ทดสอบ
ดูการให้น้ำหนักพิเศษในการยืนยัน
F
ข้อจํากัดด้านความยุติธรรม
การใช้ข้อจำกัดกับอัลกอริทึมเพื่อให้เป็นไปตามคำจำกัดความของความเป็นธรรมอย่างน้อย 1 ข้อ ตัวอย่างข้อจำกัดเกี่ยวกับความเป็นธรรม ได้แก่- หลังการประมวลผลเอาต์พุตของโมเดล
- เปลี่ยนฟังก์ชันการสูญเสียเพื่อรวมบทลงโทษเนื่องจากละเมิดเมตริกความยุติธรรม
- เพิ่มข้อจำกัดทางคณิตศาสตร์ลงในโจทย์การเพิ่มประสิทธิภาพโดยตรง
เมตริกความยุติธรรม
คำจำกัดความทางคณิตศาสตร์ของ "ความเป็นธรรม" ที่วัดผลได้ เมตริกด้านความเป็นธรรมที่ใช้กันโดยทั่วไปมีดังนี้
- โอกาสในการต่อรอง
- ความเท่าเทียมกันตามการคาดการณ์
- ความยุติธรรมที่ขัดแย้งกับความจริงใจ
- ความเท่าเทียมกันของข้อมูลประชากร
เมตริกด้านความยุติธรรมหลายรายการใช้พร้อมกันไม่ได้ โปรดดูความเข้ากันไม่ได้ของเมตริกความยุติธรรม
G
อคติการระบุแหล่งที่มาของกลุ่ม
สมมุติว่าสิ่งที่เป็นจริงสำหรับบุคคลก็เป็นเรื่องจริงสำหรับทุกคนในกลุ่มนั้นเช่นกัน ผลกระทบของอคติการระบุแหล่งที่มากลุ่มอาจรุนแรงขึ้นได้หากใช้การสุ่มตัวอย่างแบบความสะดวกในการเก็บรวบรวมข้อมูล ในตัวอย่างที่ไม่เป็นตัวแทน อาจมีการระบุแหล่งที่มา ซึ่งไม่สะท้อนความเป็นจริง
โปรดดูอคติแบบเอกพันธ์แบบนอกกลุ่มและอคติในกลุ่ม
ฮิต
อคติในอดีต
อคติประเภทหนึ่งที่มีอยู่แล้วในโลกและได้นำมาใช้เป็นชุดข้อมูล อคติเหล่านี้มีแนวโน้มที่จะสะท้อนภาพการเหมารวมทางวัฒนธรรม ความไม่เสมอภาคของข้อมูลประชากร และอคติต่อกลุ่มสังคมบางกลุ่ม
ตัวอย่างเช่น ลองพิจารณารูปแบบการจัดประเภทที่คาดการณ์ว่าผู้สมัครสินเชื่อจะเป็นค่าเริ่มต้นสำหรับสินเชื่อของตนหรือไม่ ซึ่งเราได้ฝึกตามข้อมูลประวัติเริ่มต้นของสินเชื่อในช่วงทศวรรษ 1980 จากธนาคารท้องถิ่นใน 2 ชุมชนที่แตกต่างกัน หากที่ผ่านมาผู้สมัครจากชุมชน A มีแนวโน้มที่จะไม่ทำสินเชื่อมากกว่าผู้สมัครจากชุมชน B ถึง 6 เท่า โมเดลอาจเรียนรู้ถึงความลำเอียงที่ผ่านมาซึ่งส่งผลให้รูปแบบมีแนวโน้มที่จะอนุมัติเงินกู้ในชุมชน A น้อยลง แม้ว่าเงื่อนไขในอดีตที่ส่งผลให้อัตราเริ่มต้นของชุมชนนั้นสูงขึ้นจะไม่เกี่ยวข้องอีกต่อไปก็ตาม
I
อคติโดยไม่รู้ตัว
สร้างการเชื่อมโยงหรือสมมติฐานโดยอัตโนมัติตามรูปแบบความคิดและความทรงจำของผู้ใช้ อคติโดยปริยายสามารถส่งผลต่อสิ่งต่อไปนี้
- วิธีรวบรวมและแยกประเภทข้อมูล
- วิธีออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง
เช่น เมื่อสร้างตัวแยกประเภทเพื่อระบุรูปงานแต่งงาน วิศวกรอาจใช้ชุดกระโปรงสีขาวในรูปภาพเป็นองค์ประกอบ อย่างไรก็ตาม ชุดสีขาวมีธรรมเนียมอยู่เฉพาะในบางยุคและในบางวัฒนธรรมเท่านั้น
โปรดดูการให้น้ำหนักพิเศษกับการยืนยัน
ความไม่เข้ากันของเมตริกความยุติธรรม
แนวคิดที่ว่าแนวคิดเรื่องความเป็นธรรมบางข้ออาจใช้ร่วมกันไม่ได้และไม่สามารถทำให้พอใจพร้อมกันได้ ด้วยเหตุนี้ จึงไม่มีเมตริกแบบเหมารวมรายการเดียวสำหรับการวัดความเป็นธรรมเชิงปริมาณที่ใช้กับโจทย์ ML ทั้งหมดได้
ถึงแม้เรื่องนี้อาจดูน่าท้อใจ แต่เมตริกความยุติธรรมนั้นเข้ากันไม่ได้ ไม่ได้กล่าวเป็นนัยว่าความพยายามด้านความเป็นธรรมนั้นไร้ผล แต่แสดงให้เห็นว่าปัญหา ML ต้องกำหนดความยุติธรรมจากบริบทของปัญหา โดยมีเป้าหมายในการป้องกันอันตรายต่อกรณีการใช้งานของปัญหานั้นโดยเฉพาะ
ดู "บน (im)ความเป็นไปได้แห่งความยุติธรรม" สำหรับการอภิปรายในหัวข้อนี้โดยละเอียด
ความเป็นธรรมส่วนบุคคล
เมตริกความยุติธรรมที่ตรวจสอบว่าบุคคลที่คล้ายกันได้รับการจัดประเภทคล้ายกันหรือไม่ เช่น Brobdingnagian Academy อาจต้องการดูแลความเป็นธรรมส่วนบุคคลด้วยการดูแลให้นักเรียน 2 คนที่มีเกรดเท่ากันและคะแนนสอบตามมาตรฐานมีโอกาสได้รับเข้าศึกษาเท่าๆ กัน
โปรดทราบว่าความเป็นธรรมของแต่ละบุคคลขึ้นอยู่กับการระบุ "ความคล้ายคลึงกัน" ของคุณ (ในกรณีนี้คือคะแนนและคะแนนสอบ) และคุณเสี่ยงที่จะพบกับปัญหาความยุติธรรมใหม่ๆ หากเมตริกความคล้ายคลึงกันของคุณขาดข้อมูลสำคัญ (เช่น ความเข้มงวดของหลักสูตรของนักเรียน) ไป
ดู "ความเป็นธรรมผ่านความตระหนักรู้" สำหรับการอภิปรายโดยละเอียดเกี่ยวกับความเป็นธรรมของแต่ละบุคคล
อคติในกลุ่ม
การแสดงบางส่วนต่อกลุ่มหรือลักษณะเฉพาะของตนเอง หากผู้ทดสอบหรือผู้ตรวจสอบประกอบด้วยเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาแมชชีนเลิร์นนิง ความลำเอียงในกลุ่มอาจทำให้การทดสอบผลิตภัณฑ์หรือชุดข้อมูลไม่ถูกต้อง
อคติในกลุ่มคือการให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม ดูข้อมูลเพิ่มเติมได้ในอคติจากความเป็นเอกพันธ์ภายนอกกลุ่ม
N
อคติที่ไม่ตอบ
ดูการให้น้ำหนักพิเศษในการเลือก
O
อคติจากความเป็นเอกพันธ์ภายนอกกลุ่ม
มีแนวโน้มที่จะเห็นสมาชิกกลุ่มนอกกลุ่มเดียวกันมากกว่าสมาชิกกลุ่มเมื่อเปรียบเทียบทัศนคติ ค่านิยม ลักษณะบุคลิกภาพ และลักษณะนิสัยอื่นๆ ในกลุ่มหมายถึงคนที่คุณโต้ตอบด้วยเป็นประจำ ส่วนนอกกลุ่มหมายถึงคนที่คุณไม่ได้โต้ตอบด้วยเป็นประจำ หากคุณสร้างชุดข้อมูลโดยขอให้ผู้ใช้ระบุแอตทริบิวต์เกี่ยวกับกลุ่ม แอตทริบิวต์เหล่านั้นอาจมีความละเอียดอ่อนน้อยกว่าและได้รับการเหมารวมมากกว่าแอตทริบิวต์ที่ผู้เข้าร่วมระบุไว้สำหรับผู้ที่อยู่ในกลุ่ม
เช่น Lilliputians อาจอธิบายบ้านของ Lilliputian คนอื่นๆ อย่างละเอียด โดยอ้างอิงความแตกต่างเล็กๆ น้อยๆ ของรูปแบบสถาปัตยกรรม หน้าต่าง ประตู และขนาด แต่พวก Lilliputian กลุ่มเดียวกันนี้อาจประกาศเพียงว่า Brobdingnagians ทั้งหมดอาศัยอยู่ในบ้านที่เหมือนกัน
อคติแบบเอกพันธ์ภายนอกกลุ่มเป็นรูปแบบหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม
โปรดดูอคติในกลุ่ม
คะแนน
อคติในการเข้าร่วม
คำพ้องความหมายของอคติที่ไม่ตอบ ดูการให้น้ำหนักพิเศษในการเลือก
หลังการประมวลผล
การปรับเอาต์พุตของโมเดลหลังจากที่เรียกใช้โมเดลแล้ว คุณใช้หลังการประมวลผลเพื่อบังคับใช้ข้อจำกัดด้านความเป็นธรรมได้โดยไม่ต้องแก้ไขโมเดลด้วยตนเอง
เช่น อาจมีการใช้หลังการประมวลผลกับตัวแยกประเภทแบบไบนารีโดยกำหนดเกณฑ์การจัดประเภทให้คงความเท่าเทียมกันของโอกาสสำหรับบางแอตทริบิวต์โดยการตรวจสอบว่าอัตราผลบวกจริงมีค่าเหมือนกันสำหรับค่าทั้งหมดของแอตทริบิวต์นั้น
ความเท่าเทียมกันตามการคาดการณ์
เมตริกความยุติธรรมที่ตรวจสอบว่าอัตราความแม่นยําของความแม่นยําเทียบเท่ากับกลุ่มย่อยที่อยู่ภายใต้การพิจารณาหรือไม่สำหรับตัวแยกประเภทหนึ่งๆ
เช่น โมเดลที่คาดการณ์ว่านักศึกษาจะเข้าเรียนระดับวิทยาลัยจะมีความเท่าเทียมในการคาดการณ์สำหรับสัญชาติ หากอัตราความแม่นยำเท่ากันสำหรับ Lilliputians และ Brobdingnagians
ความเท่าเทียมกันตามการคาดการณ์บางครั้งเรียกอีกอย่างว่าความเท่าเทียมกันของอัตราตามการคาดการณ์
โปรดดู "อธิบายคำนิยามความเป็นธรรม" (ส่วนที่ 3.2.1) สำหรับการอภิปรายอย่างละเอียดเกี่ยวกับความเท่าเทียมกันตามการคาดการณ์
ความเท่าเทียมกันของอัตราการคาดการณ์
อีกชื่อหนึ่งของความเท่าเทียมกันตามการคาดการณ์
การประมวลผลล่วงหน้า
การประมวลผลข้อมูลก่อนนำไปใช้เพื่อฝึกโมเดล การประมวลผลล่วงหน้าอาจทำได้ง่ายมาก เช่น การนำคำออกจากคลังข้อความภาษาอังกฤษซึ่งไม่มีอยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจซับซ้อนอย่างการแสดงจุดข้อมูลซ้ำในลักษณะที่ทำให้ลบแอตทริบิวต์ที่เชื่อมโยงกับแอตทริบิวต์ที่ละเอียดอ่อนออกให้มากที่สุด การประมวลผลล่วงหน้าช่วยให้ปฏิบัติตามข้อจํากัดด้านความเป็นธรรมได้พร็อกซี (แอตทริบิวต์ที่มีความละเอียดอ่อน)
แอตทริบิวต์ที่ใช้เป็นสแตนด์อินสำหรับแอตทริบิวต์ที่มีความละเอียดอ่อน เช่น รหัสไปรษณีย์ของบุคคลธรรมดาอาจใช้เป็นตัวแทนสำหรับรายได้ เชื้อชาติ หรือชาติพันธุ์ของบุคคลนั้นR
อคติในการรายงาน
ข้อเท็จจริงที่ว่าความถี่ที่ผู้ใช้เขียนเกี่ยวกับการกระทำ ผลลัพธ์ หรือคุณสมบัติ ไม่ได้สะท้อนถึงความถี่ในโลกจริงหรือระดับของคุณสมบัติที่มีลักษณะเป็นของกลุ่มคน อคติในการรายงานอาจส่งผลต่อองค์ประกอบของข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้
เช่น ในหนังสือ คำว่าหัวเราะจะแพร่หลายกว่าหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่สัมพัทธ์ของการหัวเราะและการหายใจจากคลังหนังสืออาจบอกได้ว่าการหัวเราะเป็นมากกว่าการหายใจ
S
อคติจากการสุ่มตัวอย่าง
ดูการให้น้ำหนักพิเศษในการเลือก
อคติการเลือก
ข้อผิดพลาดในข้อสรุปที่มาจากข้อมูลตัวอย่างเนื่องจากกระบวนการเลือกที่ทำให้เกิดความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตในข้อมูลกับตัวอย่างที่สังเกตไม่ได้ ความลำเอียงในการเลือกรูปแบบต่อไปนี้มีอยู่:
- อคติด้านความครอบคลุม: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับประชากรที่โมเดลแมชชีนเลิร์นนิงคาดการณ์
- การให้น้ำหนักการสุ่มตัวอย่าง: จะไม่มีการรวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
- อคติที่ไม่ตอบ (หรือที่เรียกว่าอคติในการเข้าร่วม): ผู้ใช้จากบางกลุ่มเลือกไม่รับแบบสำรวจในอัตราที่แตกต่างจากผู้ใช้จากกลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าคุณกำลังสร้างโมเดลแมชชีนเลิร์นนิงที่คาดการณ์ ความชื่นชอบของผู้คนในภาพยนตร์ ในการเก็บข้อมูลการฝึกอบรม คุณต้องแจกแบบสำรวจให้ทุกคนที่อยู่แถวหน้าของโรงภาพยนตร์ที่กำลังฉายภาพยนตร์นั้น วิธีนี้อาจฟังดูเป็นวิธีที่เหมาะสมในการรวบรวมชุดข้อมูล อย่างไรก็ตาม การเก็บรวบรวมข้อมูลในรูปแบบนี้อาจทําให้เกิดความไม่เป็นกลางในการเลือกรูปแบบต่อไปนี้
- อคติด้านความครอบคลุม: ด้วยการสุ่มกลุ่มจากประชากรที่เลือกดูภาพยนตร์ การคาดคะเนของโมเดลของคุณอาจไม่ทำให้เนื้อหาทั่วไปแก่ผู้ที่ไม่ได้แสดงความสนใจในภาพยนตร์ในระดับนั้น
- การให้น้ำหนักพิเศษในการสุ่มตัวอย่าง: แทนที่จะสุ่มสุ่มตัวอย่างจากประชากรเป้าหมาย (ทุกคนในภาพยนตร์) คุณได้สุ่มตัวอย่างเฉพาะคนที่อยู่ในแถวหน้า อาจเป็นไปได้ว่าคนที่อยู่แถวหน้าสนใจภาพยนตร์เรื่องนั้นมากกว่าคนที่อยู่ในแถวอื่นๆ
- อคติที่ไม่ตอบ: โดยทั่วไป ผู้ที่มีความคิดเห็นรุนแรงมักจะตอบแบบสอบถามที่ไม่บังคับบ่อยกว่าคนที่มีความคิดเห็นเล็กน้อย เนื่องจากแบบสำรวจภาพยนตร์เป็นแบบสำรวจที่ไม่บังคับ คำตอบจึงมีแนวโน้มที่จะสร้างการกระจายแบบ 2 โมดัลมากกว่าการแจกแจงแบบปกติ (รูปกระดิ่ง)
แอตทริบิวต์ที่ละเอียดอ่อน
แอตทริบิวต์ของมนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษเนื่องจากเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนบุคคลU
ไม่ทราบ (สำหรับแอตทริบิวต์ที่มีความละเอียดอ่อน)
สถานการณ์ที่มีแอตทริบิวต์ที่มีความละเอียดอ่อน แต่ไม่ได้รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่มีความละเอียดอ่อนมักสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูลบุคคล โมเดลที่ฝึกโดยไม่รู้ตัวเกี่ยวกับแอตทริบิวต์ที่มีความละเอียดอ่อนจึงยังคงมีผลกระทบที่แตกต่างกันในส่วนที่เกี่ยวกับแอตทริบิวต์นั้น หรือละเมิดข้อจำกัดเกี่ยวกับความเป็นธรรมอื่นๆ