อภิธานศัพท์แมชชีนเลิร์นนิง: ความยุติธรรม

หน้านี้มีคำศัพท์เกี่ยวกับความเป็นธรรม หากต้องการดูคำศัพท์ในอภิธานศัพท์ทั้งหมด คลิกที่นี่

A

แอตทริบิวต์

#fairness

คำพ้องความหมายของ feature

ในความเป็นธรรมของแมชชีนเลิร์นนิง แอตทริบิวต์มักจะหมายถึงลักษณะเฉพาะที่เกี่ยวข้องกับบุคคล

อคติการทำงานอัตโนมัติ

#fairness

เมื่อผู้มีอำนาจตัดสินใจชอบคำแนะนำจากระบบการตัดสินใจอัตโนมัติมากกว่าข้อมูลที่ไม่มีการทำงานอัตโนมัติ แม้ว่าระบบการตัดสินใจอัตโนมัติจะเกิดข้อผิดพลาดก็ตาม

B

อคติ (จริยธรรม/ความเป็นธรรม)

#fairness
#fundamentals

1. การเหมารวม อคติ หรือรายการโปรดกับบางสิ่ง บุคคล หรือกลุ่มบุคคลมากกว่าผู้อื่น อคติเหล่านี้อาจส่งผลต่อการรวบรวมและการตีความข้อมูล การออกแบบระบบ และวิธีที่ผู้ใช้โต้ตอบกับระบบ รูปแบบของการให้น้ำหนักพิเศษประเภทนี้ได้แก่

2. ข้อผิดพลาดอย่างเป็นระบบซึ่งเกิดขึ้นจากขั้นตอนการสุ่มตัวอย่างหรือการรายงาน รูปแบบของการให้น้ำหนักพิเศษประเภทนี้ได้แก่

อย่าสับสนกับคำศัพท์ที่มีอคติในโมเดลแมชชีนเลิร์นนิงหรืออคติของการคาดการณ์

C

อคติยืนยันความคิดตัวเอง

#fairness

แนวโน้มในการค้นหา ตีความ สนับสนุน และการเรียกคืนข้อมูลในลักษณะที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ก่อนแล้ว นักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิงอาจรวบรวมหรือติดป้ายกำกับข้อมูลในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่โดยไม่ได้ตั้งใจ อคติยืนยันเป็นรูปแบบหนึ่งของการให้น้ำหนักพิเศษโดยปริยาย

อคติของผู้ทดสอบเป็นรูปแบบของอคติการยืนยันที่ผู้ทดสอบฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่ก่อน

ความยุติธรรมที่พิสูจน์ได้จริง

#fairness

เมตริกความยุติธรรมที่ตรวจสอบว่าตัวแยกประเภทสร้างผลลัพธ์ให้กับบุคคลรายหนึ่งเช่นเดียวกับอีกบุคคลหนึ่งที่เหมือนกับบุคคลแรกหรือไม่ ยกเว้นกรณีที่เกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินตัวแยกประเภทเพื่อความเป็นธรรมที่โต้แย้งความจริงเป็นวิธีการหนึ่งในการแสดงแหล่งอคติที่อาจเกิดขึ้นในโมเดล

ดู "When Worlds Collide: Integrating Different Different Counterf true Assumptions in Fairness" สำหรับการอภิปรายอย่างละเอียดเกี่ยวกับความเป็นธรรมที่โต้แย้งกัน

อคติเรื่องความครอบคลุม

#fairness

ดูการให้น้ำหนักพิเศษในการเลือก

D

ความเท่าเทียมกันของข้อมูลประชากร

#fairness

เมตริกความยุติธรรมที่จะพึงพอใจหากผลลัพธ์การจัดประเภทของโมเดลไม่ขึ้นอยู่กับแอตทริบิวต์ที่มีความละเอียดอ่อนที่ระบุ

ตัวอย่างเช่น ถ้าทั้ง Lilliputians และ Brobdingnagians สมัครเข้ามหาวิทยาลัย Glubbdubdrib จะมีความเท่าเทียมของข้อมูลประชากรหากเปอร์เซ็นต์ของ Lilliputians ที่เข้าสอบมีค่าเท่ากับเปอร์เซ็นต์ของ Brobdingnagians ที่เข้าเรียน ไม่ว่าโดยเฉลี่ยแล้วกลุ่มใดจะมีคุณสมบัติมากกว่ากลุ่มอื่น

ตรงข้ามกับความน่าจะเป็นที่เท่ากันและความเท่าเทียมกันของโอกาส ซึ่งทําให้การแยกประเภทผลลัพธ์แบบรวมขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน แต่ไม่อนุญาตให้ผลการแยกประเภทสําหรับป้ายกํากับข้อมูลที่ได้จากการสังเกตการณ์ที่ระบุบางรายการขึ้นอยู่กับแอตทริบิวต์ที่มีความละเอียดอ่อน ดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น" สำหรับภาพที่แสดงข้อดีและข้อเสียต่างๆ เมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมของข้อมูลประชากร

ผลกระทบที่แตกต่างกัน

#fairness

การตัดสินใจเกี่ยวกับผู้คนที่ส่งผลกระทบต่อ ประชากรกลุ่มต่างๆ ในสัดส่วนที่มากกว่า ซึ่งมักจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจของอัลกอริทึมส่งผลเสียหรือให้ประโยชน์แก่กลุ่มย่อยบางกลุ่มมากกว่ากลุ่มอื่นๆ

ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่กำหนดการมีสิทธิ์ของ Lilliputian สำหรับสินเชื่อบ้านขนาดเล็กมีแนวโน้มที่จะจัดว่า "ไม่มีสิทธิ์" มากกว่าในกรณีที่ที่อยู่จัดส่งมีรหัสไปรษณีย์เฉพาะ หาก Lilliputian ซึ่งเป็นชาวบิ๊กเอนด์มีแนวโน้มที่จะมีที่อยู่ทางไปรษณีย์ที่มีรหัสไปรษณีย์นี้มากกว่า Lilliputians ของ Little-Endian อัลกอริทึมนี้อาจส่งผลกระทบที่แตกต่างกัน

ซึ่งตรงข้ามกับการปฏิบัติที่แตกต่างกัน ซึ่งมุ่งเน้นที่ความไม่สอดคล้องที่เกิดขึ้นเมื่อลักษณะของกลุ่มย่อยเป็นข้อมูลป้อนเข้าในกระบวนการตัดสินใจแบบอัลกอริทึมอย่างชัดเจน

การปฏิบัติที่แตกต่างกัน

#fairness

การคำนึงถึงคุณลักษณะที่มีความละเอียดอ่อนของผู้ที่อยู่ในกระบวนการตัดสินใจตามอัลกอริทึมเพื่อทำให้กลุ่มย่อยของกลุ่มคนต่างๆ ได้รับการปฏิบัติไม่เหมือนกัน

เช่น ลองพิจารณาอัลกอริทึมที่กำหนดการมีสิทธิ์ของ Lilliputians สำหรับสินเชื่อบ้านขนาดเล็กตามข้อมูลที่ให้ไว้ในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้การเชื่อมโยงของ Liliputian ในชื่อ Big-Endian หรือ Little-Endian เป็นอินพุต ก็จะเป็นการแสดงการปฏิบัติที่แตกต่างกันตามมิติข้อมูลนั้น

ตรงข้ามกับผลกระทบที่แตกต่างกัน ซึ่งมุ่งเน้นที่ความไม่เท่าเทียมในผลกระทบทางสังคมของการตัดสินใจทางอัลกอริทึมที่มีต่อกลุ่มย่อย ไม่ว่ากลุ่มย่อยเหล่านั้นจะเป็นอินพุตของโมเดลหรือไม่ก็ตาม

จ.

ความเท่าเทียมของโอกาส

#fairness

เมตริกความยุติธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ที่ต้องการได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่มีความละเอียดอ่อนหรือไม่ กล่าวคือ หากผลลัพธ์ที่ต้องการสำหรับโมเดลคือคลาสเชิงบวก เป้าหมายก็จะให้อัตราผลบวกจริงเหมือนกันสำหรับทุกกลุ่ม

ความเท่าเทียมของโอกาสเกี่ยวข้องกับความน่าจะเป็นที่เท่าเทียมกัน ซึ่งกําหนดให้ทั้งอัตราผลบวกจริงและอัตราผลบวกลวงต้องเหมือนกันในทุกกลุ่ม

สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians เข้าเรียนในโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาของ Lilliputians มีชั้นเรียนคณิตศาสตร์ที่มีประสิทธิภาพและนักเรียนส่วนใหญ่มีคุณสมบัติเข้าเรียนโปรแกรมของมหาวิทยาลัย โรงเรียนมัธยมศึกษาของ Brobdingnagians จึงไม่มีชั้นเรียนคณิตศาสตร์เลย จึงทำให้ไม่มีนักเรียนที่มีคุณสมบัติเพียงพอ ความเท่าเทียมกันของโอกาสคือระดับซึ่งสอดคล้องกับป้ายกำกับที่ต้องการเป็น "ยอมรับ" ในส่วนที่เกี่ยวกับสัญชาติ (Lilliputian หรือ Brobdingnagian) หากนักเรียนที่มีคุณสมบัติตามเกณฑ์มีแนวโน้มที่จะรับเข้าศึกษาได้เท่ากันไม่ว่านักเรียนจะเป็น Lilliputian หรือ Brobdingnagian

ตัวอย่างเช่น สมมติว่าชาวลิลลิปูชัน 100 คนและบรอบดิงนาเจียน 100 คนสมัครเข้ามหาวิทยาลัย Glubbdubdrib และตัดสินใจรับสมัครนักศึกษาดังนี้

ตารางที่ 1 ผู้สมัคร Lilliputian (90% มีคุณสมบัติครบถ้วน)

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 45 3
ปฏิเสธแล้ว 45 7
รวม 90 10
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 45/90 = 50%
เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติที่ถูกปฏิเสธ: 7/10 = 70%
เปอร์เซ็นต์รวมของนักเรียน Lilliputian ที่รับเข้าศึกษาคือ (45+3)/100 = 48%

 

ตารางที่ 2 ผู้สมัคร Brobdingnagian (10% มีคุณสมบัติครบถ้วน):

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 5 9
ปฏิเสธแล้ว 5 81
รวม 10 90
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 5/10 = 50%
เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองที่ถูกปฏิเสธ: 81/90 = 90%
เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่รับเข้าศึกษา: (5+9)/100 = 14%

ตัวอย่างก่อนหน้านี้แสดงให้เห็นถึงความเท่าเทียมของโอกาสในการยอมรับนักเรียนที่มีคุณสมบัติเหมาะสม เนื่องจากทั้ง Lilliputians และ Brobdingnagians ที่มีคุณสมบัติเหมาะสมมีโอกาส 50% ที่จะได้เข้าศึกษา

แม้เราจะพึงพอใจเท่าๆ กัน แต่เมตริกด้านความเป็นธรรม 2 ประการต่อไปนี้ไม่ได้รับการตอบสนอง

  • ความเท่าเทียมกันของข้อมูลประชากร: Lilliputian และ Brobdingnagians เข้ามหาวิทยาลัยในอัตราที่แตกต่างกัน โดย 48% ของนักเรียน Lilliputian ได้รับเข้าศึกษา แต่มีเพียง 14% ของนักศึกษา Brobdingnagian ที่เข้ามหาวิทยาลัย
  • โอกาสในการเข้าเรียนที่เท่าเทียมกัน: แม้ว่านักเรียนจาก Lilliputian และ Brobdingnagian ที่มีคุณสมบัติเหมาะสมจะได้รับโอกาสเข้ารับการศึกษาเหมือนกัน แต่ข้อจำกัดเพิ่มเติมที่นักเรียน Lilliputian และ Brobdingnagians ไม่ผ่านการรับรองมีโอกาสที่ถูกปฏิเสธเท่ากัน Lilliputian ที่ไม่มีคุณสมบัติมีอัตราการปฏิเสธ 70% ขณะที่ Brobdingnagians ที่ไม่เข้าเกณฑ์มีอัตราการปฏิเสธ 90%

ดู "ความเท่าเทียมของโอกาสในการเรียนรู้ที่มีการควบคุมดูแล" เพื่อดูรายละเอียดเพิ่มเติมเกี่ยวกับความเท่าเทียมของโอกาส นอกจากนี้ โปรดดู "การโจมตี การเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น" สำหรับภาพที่แสดงข้อดีและข้อเสียต่างๆ เมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมของโอกาส

ความน่าจะเป็นที่เท่ากัน

#fairness

เมตริกความยุติธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่มีความละเอียดอ่อน โดยเคารพทั้งคลาสเชิงบวกและคลาสเชิงลบ ไม่ใช่แค่คลาสใดคลาสหนึ่งหรือคลาสอื่นๆ โดยเฉพาะ กล่าวคือ ทั้งอัตราผลบวกจริงและอัตราผลบวกลวงควรเหมือนกันสำหรับทุกกลุ่ม

ความน่าจะเป็นที่เท่าเทียมกันจะเกี่ยวข้องกับความเท่าเทียมกันของโอกาส ซึ่งมุ่งเน้นที่อัตราข้อผิดพลาดเพียงคลาสเดียว (เชิงบวกหรือเชิงลบ)

ตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians เข้าเรียนในโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาของ Lilliputians มีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพและนักเรียนส่วนใหญ่มีคุณสมบัติสำหรับโปรแกรมของมหาวิทยาลัย โรงเรียนมัธยมศึกษาของ Brobdingnagians จึงไม่มีชั้นเรียนคณิตศาสตร์เลย จึงทำให้ไม่มีนักเรียนที่มีคุณสมบัติมากนัก ผู้สมัครได้รับเลือกให้มีโอกาสได้รับความพึงพอใจอย่างเท่าเทียมกันโดยมีเงื่อนไขว่าผู้สมัครเป็น Lilliputian หรือ Brobdingnagian ได้หากมีคุณสมบัติครบถ้วน ผู้สมัครก็มีแนวโน้มที่จะได้รับเลือกเข้าร่วมโปรแกรมได้ในระดับเดียวกัน และหากไม่มีสิทธิ์ ผู้สมัครก็มีแนวโน้มที่จะถูกปฏิเสธไม่แพ้กัน

สมมติว่ามีนักศึกษา Lilliputian 100 คนและ Brobdingnagians อีก 100 คนสมัครเข้าร่วมมหาวิทยาลัย Glubbdubdrib และตัดสินใจเรื่องการรับนักศึกษาดังนี้

ตารางที่ 3 ผู้สมัคร Lilliputian (90% มีคุณสมบัติครบถ้วน)

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 45 2
ปฏิเสธแล้ว 45 8
รวม 90 10
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 45/90 = 50%
เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติที่ถูกปฏิเสธ: 8/10 = 80%
เปอร์เซ็นต์รวมของนักเรียน Lilliputian ที่รับเข้าศึกษา: (45+2)/100 = 47%

 

ตารางที่ 4 ผู้สมัคร Brobdingnagian (10% มีคุณสมบัติครบถ้วน):

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 5 18
ปฏิเสธแล้ว 5 72
รวม 10 90
เปอร์เซ็นต์ของนักเรียนที่เข้าเกณฑ์ซึ่งเข้าศึกษา: 5/10 = 50%
เปอร์เซ็นต์ของนักเรียนที่ขาดคุณสมบัติซึ่งถูกปฏิเสธ: 72/90 = 80%
เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่รับเข้าศึกษา: (5+18)/100 = 23%

คำตอบที่เท่าเทียมกันนั้นพึงพอใจเพราะนักเรียนของ Lilliputian และ Brobdingnagian ที่มีคุณสมบัติตามเกณฑ์มีโอกาสได้รับเลือกให้เข้าศึกษาถึง 50% และ Lilliputian และ Brobdingnagian ที่ขาดคุณสมบัติมีโอกาสจะถูกปฏิเสธ 80%

ความน่าจะเป็นแบบเท่ากันมีคำจำกัดความอย่างเป็นทางการไว้ใน "ความเท่าเทียมของโอกาสในการเรียนรู้ภายใต้การควบคุมดูแล" ดังนี้ "ผู้คาดการณ์ เริ่มต้นด้วยความเป็นไปได้ที่เท่ากันซึ่งเกี่ยวข้องกับแอตทริบิวต์ A และผลลัพธ์ Y หาก บัญญัติ และ A เป็นอิสระ โดยมีเงื่อนไขบน Y"

อคติของผู้ทดสอบ

#fairness

ดูการให้น้ำหนักพิเศษในการยืนยัน

F

ข้อจํากัดด้านความยุติธรรม

#fairness
การใช้ข้อจำกัดกับอัลกอริทึมเพื่อให้เป็นไปตามคำจำกัดความของความเป็นธรรมอย่างน้อย 1 ข้อ ตัวอย่างข้อจำกัดเกี่ยวกับความเป็นธรรม ได้แก่

เมตริกความยุติธรรม

#fairness

คำจำกัดความทางคณิตศาสตร์ของ "ความเป็นธรรม" ที่วัดผลได้ เมตริกด้านความเป็นธรรมที่ใช้กันโดยทั่วไปมีดังนี้

เมตริกด้านความยุติธรรมหลายรายการใช้พร้อมกันไม่ได้ โปรดดูความเข้ากันไม่ได้ของเมตริกความยุติธรรม

G

อคติการระบุแหล่งที่มาของกลุ่ม

#fairness

สมมุติว่าสิ่งที่เป็นจริงสำหรับบุคคลก็เป็นเรื่องจริงสำหรับทุกคนในกลุ่มนั้นเช่นกัน ผลกระทบของอคติการระบุแหล่งที่มากลุ่มอาจรุนแรงขึ้นได้หากใช้การสุ่มตัวอย่างแบบความสะดวกในการเก็บรวบรวมข้อมูล ในตัวอย่างที่ไม่เป็นตัวแทน อาจมีการระบุแหล่งที่มา ซึ่งไม่สะท้อนความเป็นจริง

โปรดดูอคติแบบเอกพันธ์แบบนอกกลุ่มและอคติในกลุ่ม

ฮิต

อคติในอดีต

#fairness

อคติประเภทหนึ่งที่มีอยู่แล้วในโลกและได้นำมาใช้เป็นชุดข้อมูล อคติเหล่านี้มีแนวโน้มที่จะสะท้อนภาพการเหมารวมทางวัฒนธรรม ความไม่เสมอภาคของข้อมูลประชากร และอคติต่อกลุ่มสังคมบางกลุ่ม

ตัวอย่างเช่น ลองพิจารณารูปแบบการจัดประเภทที่คาดการณ์ว่าผู้สมัครสินเชื่อจะเป็นค่าเริ่มต้นสำหรับสินเชื่อของตนหรือไม่ ซึ่งเราได้ฝึกตามข้อมูลประวัติเริ่มต้นของสินเชื่อในช่วงทศวรรษ 1980 จากธนาคารท้องถิ่นใน 2 ชุมชนที่แตกต่างกัน หากที่ผ่านมาผู้สมัครจากชุมชน A มีแนวโน้มที่จะไม่ทำสินเชื่อมากกว่าผู้สมัครจากชุมชน B ถึง 6 เท่า โมเดลอาจเรียนรู้ถึงความลำเอียงที่ผ่านมาซึ่งส่งผลให้รูปแบบมีแนวโน้มที่จะอนุมัติเงินกู้ในชุมชน A น้อยลง แม้ว่าเงื่อนไขในอดีตที่ส่งผลให้อัตราเริ่มต้นของชุมชนนั้นสูงขึ้นจะไม่เกี่ยวข้องอีกต่อไปก็ตาม

I

อคติโดยไม่รู้ตัว

#fairness

สร้างการเชื่อมโยงหรือสมมติฐานโดยอัตโนมัติตามรูปแบบความคิดและความทรงจำของผู้ใช้ อคติโดยปริยายสามารถส่งผลต่อสิ่งต่อไปนี้

  • วิธีรวบรวมและแยกประเภทข้อมูล
  • วิธีออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง

เช่น เมื่อสร้างตัวแยกประเภทเพื่อระบุรูปงานแต่งงาน วิศวกรอาจใช้ชุดกระโปรงสีขาวในรูปภาพเป็นองค์ประกอบ อย่างไรก็ตาม ชุดสีขาวมีธรรมเนียมอยู่เฉพาะในบางยุคและในบางวัฒนธรรมเท่านั้น

โปรดดูการให้น้ำหนักพิเศษกับการยืนยัน

ความไม่เข้ากันของเมตริกความยุติธรรม

#fairness

แนวคิดที่ว่าแนวคิดเรื่องความเป็นธรรมบางข้ออาจใช้ร่วมกันไม่ได้และไม่สามารถทำให้พอใจพร้อมกันได้ ด้วยเหตุนี้ จึงไม่มีเมตริกแบบเหมารวมรายการเดียวสำหรับการวัดความเป็นธรรมเชิงปริมาณที่ใช้กับโจทย์ ML ทั้งหมดได้

ถึงแม้เรื่องนี้อาจดูน่าท้อใจ แต่เมตริกความยุติธรรมนั้นเข้ากันไม่ได้ ไม่ได้กล่าวเป็นนัยว่าความพยายามด้านความเป็นธรรมนั้นไร้ผล แต่แสดงให้เห็นว่าปัญหา ML ต้องกำหนดความยุติธรรมจากบริบทของปัญหา โดยมีเป้าหมายในการป้องกันอันตรายต่อกรณีการใช้งานของปัญหานั้นโดยเฉพาะ

ดู "บน (im)ความเป็นไปได้แห่งความยุติธรรม" สำหรับการอภิปรายในหัวข้อนี้โดยละเอียด

ความเป็นธรรมส่วนบุคคล

#fairness

เมตริกความยุติธรรมที่ตรวจสอบว่าบุคคลที่คล้ายกันได้รับการจัดประเภทคล้ายกันหรือไม่ เช่น Brobdingnagian Academy อาจต้องการดูแลความเป็นธรรมส่วนบุคคลด้วยการดูแลให้นักเรียน 2 คนที่มีเกรดเท่ากันและคะแนนสอบตามมาตรฐานมีโอกาสได้รับเข้าศึกษาเท่าๆ กัน

โปรดทราบว่าความเป็นธรรมของแต่ละบุคคลขึ้นอยู่กับการระบุ "ความคล้ายคลึงกัน" ของคุณ (ในกรณีนี้คือคะแนนและคะแนนสอบ) และคุณเสี่ยงที่จะพบกับปัญหาความยุติธรรมใหม่ๆ หากเมตริกความคล้ายคลึงกันของคุณขาดข้อมูลสำคัญ (เช่น ความเข้มงวดของหลักสูตรของนักเรียน) ไป

ดู "ความเป็นธรรมผ่านความตระหนักรู้" สำหรับการอภิปรายโดยละเอียดเกี่ยวกับความเป็นธรรมของแต่ละบุคคล

อคติในกลุ่ม

#fairness

การแสดงบางส่วนต่อกลุ่มหรือลักษณะเฉพาะของตนเอง หากผู้ทดสอบหรือผู้ตรวจสอบประกอบด้วยเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาแมชชีนเลิร์นนิง ความลำเอียงในกลุ่มอาจทำให้การทดสอบผลิตภัณฑ์หรือชุดข้อมูลไม่ถูกต้อง

อคติในกลุ่มคือการให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม ดูข้อมูลเพิ่มเติมได้ในอคติจากความเป็นเอกพันธ์ภายนอกกลุ่ม

N

อคติที่ไม่ตอบ

#fairness

ดูการให้น้ำหนักพิเศษในการเลือก

O

อคติจากความเป็นเอกพันธ์ภายนอกกลุ่ม

#fairness

มีแนวโน้มที่จะเห็นสมาชิกกลุ่มนอกกลุ่มเดียวกันมากกว่าสมาชิกกลุ่มเมื่อเปรียบเทียบทัศนคติ ค่านิยม ลักษณะบุคลิกภาพ และลักษณะนิสัยอื่นๆ ในกลุ่มหมายถึงคนที่คุณโต้ตอบด้วยเป็นประจำ ส่วนนอกกลุ่มหมายถึงคนที่คุณไม่ได้โต้ตอบด้วยเป็นประจำ หากคุณสร้างชุดข้อมูลโดยขอให้ผู้ใช้ระบุแอตทริบิวต์เกี่ยวกับกลุ่ม แอตทริบิวต์เหล่านั้นอาจมีความละเอียดอ่อนน้อยกว่าและได้รับการเหมารวมมากกว่าแอตทริบิวต์ที่ผู้เข้าร่วมระบุไว้สำหรับผู้ที่อยู่ในกลุ่ม

เช่น Lilliputians อาจอธิบายบ้านของ Lilliputian คนอื่นๆ อย่างละเอียด โดยอ้างอิงความแตกต่างเล็กๆ น้อยๆ ของรูปแบบสถาปัตยกรรม หน้าต่าง ประตู และขนาด แต่พวก Lilliputian กลุ่มเดียวกันนี้อาจประกาศเพียงว่า Brobdingnagians ทั้งหมดอาศัยอยู่ในบ้านที่เหมือนกัน

อคติแบบเอกพันธ์ภายนอกกลุ่มเป็นรูปแบบหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม

โปรดดูอคติในกลุ่ม

คะแนน

อคติในการเข้าร่วม

#fairness

คำพ้องความหมายของอคติที่ไม่ตอบ ดูการให้น้ำหนักพิเศษในการเลือก

หลังการประมวลผล

#fairness
#fundamentals

การปรับเอาต์พุตของโมเดลหลังจากที่เรียกใช้โมเดลแล้ว คุณใช้หลังการประมวลผลเพื่อบังคับใช้ข้อจำกัดด้านความเป็นธรรมได้โดยไม่ต้องแก้ไขโมเดลด้วยตนเอง

เช่น อาจมีการใช้หลังการประมวลผลกับตัวแยกประเภทแบบไบนารีโดยกำหนดเกณฑ์การจัดประเภทให้คงความเท่าเทียมกันของโอกาสสำหรับบางแอตทริบิวต์โดยการตรวจสอบว่าอัตราผลบวกจริงมีค่าเหมือนกันสำหรับค่าทั้งหมดของแอตทริบิวต์นั้น

ความเท่าเทียมกันตามการคาดการณ์

#fairness

เมตริกความยุติธรรมที่ตรวจสอบว่าอัตราความแม่นยําของความแม่นยําเทียบเท่ากับกลุ่มย่อยที่อยู่ภายใต้การพิจารณาหรือไม่สำหรับตัวแยกประเภทหนึ่งๆ

เช่น โมเดลที่คาดการณ์ว่านักศึกษาจะเข้าเรียนระดับวิทยาลัยจะมีความเท่าเทียมในการคาดการณ์สำหรับสัญชาติ หากอัตราความแม่นยำเท่ากันสำหรับ Lilliputians และ Brobdingnagians

ความเท่าเทียมกันตามการคาดการณ์บางครั้งเรียกอีกอย่างว่าความเท่าเทียมกันของอัตราตามการคาดการณ์

โปรดดู "อธิบายคำนิยามความเป็นธรรม" (ส่วนที่ 3.2.1) สำหรับการอภิปรายอย่างละเอียดเกี่ยวกับความเท่าเทียมกันตามการคาดการณ์

ความเท่าเทียมกันของอัตราการคาดการณ์

#fairness

อีกชื่อหนึ่งของความเท่าเทียมกันตามการคาดการณ์

การประมวลผลล่วงหน้า

#fairness
การประมวลผลข้อมูลก่อนนำไปใช้เพื่อฝึกโมเดล การประมวลผลล่วงหน้าอาจทำได้ง่ายมาก เช่น การนำคำออกจากคลังข้อความภาษาอังกฤษซึ่งไม่มีอยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจซับซ้อนอย่างการแสดงจุดข้อมูลซ้ำในลักษณะที่ทำให้ลบแอตทริบิวต์ที่เชื่อมโยงกับแอตทริบิวต์ที่ละเอียดอ่อนออกให้มากที่สุด การประมวลผลล่วงหน้าช่วยให้ปฏิบัติตามข้อจํากัดด้านความเป็นธรรมได้

พร็อกซี (แอตทริบิวต์ที่มีความละเอียดอ่อน)

#fairness
แอตทริบิวต์ที่ใช้เป็นสแตนด์อินสำหรับแอตทริบิวต์ที่มีความละเอียดอ่อน เช่น รหัสไปรษณีย์ของบุคคลธรรมดาอาจใช้เป็นตัวแทนสำหรับรายได้ เชื้อชาติ หรือชาติพันธุ์ของบุคคลนั้น

R

อคติในการรายงาน

#fairness

ข้อเท็จจริงที่ว่าความถี่ที่ผู้ใช้เขียนเกี่ยวกับการกระทำ ผลลัพธ์ หรือคุณสมบัติ ไม่ได้สะท้อนถึงความถี่ในโลกจริงหรือระดับของคุณสมบัติที่มีลักษณะเป็นของกลุ่มคน อคติในการรายงานอาจส่งผลต่อองค์ประกอบของข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้

เช่น ในหนังสือ คำว่าหัวเราะจะแพร่หลายกว่าหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่สัมพัทธ์ของการหัวเราะและการหายใจจากคลังหนังสืออาจบอกได้ว่าการหัวเราะเป็นมากกว่าการหายใจ

S

อคติจากการสุ่มตัวอย่าง

#fairness

ดูการให้น้ำหนักพิเศษในการเลือก

อคติการเลือก

#fairness

ข้อผิดพลาดในข้อสรุปที่มาจากข้อมูลตัวอย่างเนื่องจากกระบวนการเลือกที่ทำให้เกิดความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตในข้อมูลกับตัวอย่างที่สังเกตไม่ได้ ความลำเอียงในการเลือกรูปแบบต่อไปนี้มีอยู่:

  • อคติด้านความครอบคลุม: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับประชากรที่โมเดลแมชชีนเลิร์นนิงคาดการณ์
  • การให้น้ำหนักการสุ่มตัวอย่าง: จะไม่มีการรวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
  • อคติที่ไม่ตอบ (หรือที่เรียกว่าอคติในการเข้าร่วม): ผู้ใช้จากบางกลุ่มเลือกไม่รับแบบสำรวจในอัตราที่แตกต่างจากผู้ใช้จากกลุ่มอื่นๆ

ตัวอย่างเช่น สมมติว่าคุณกำลังสร้างโมเดลแมชชีนเลิร์นนิงที่คาดการณ์ ความชื่นชอบของผู้คนในภาพยนตร์ ในการเก็บข้อมูลการฝึกอบรม คุณต้องแจกแบบสำรวจให้ทุกคนที่อยู่แถวหน้าของโรงภาพยนตร์ที่กำลังฉายภาพยนตร์นั้น วิธีนี้อาจฟังดูเป็นวิธีที่เหมาะสมในการรวบรวมชุดข้อมูล อย่างไรก็ตาม การเก็บรวบรวมข้อมูลในรูปแบบนี้อาจทําให้เกิดความไม่เป็นกลางในการเลือกรูปแบบต่อไปนี้

  • อคติด้านความครอบคลุม: ด้วยการสุ่มกลุ่มจากประชากรที่เลือกดูภาพยนตร์ การคาดคะเนของโมเดลของคุณอาจไม่ทำให้เนื้อหาทั่วไปแก่ผู้ที่ไม่ได้แสดงความสนใจในภาพยนตร์ในระดับนั้น
  • การให้น้ำหนักพิเศษในการสุ่มตัวอย่าง: แทนที่จะสุ่มสุ่มตัวอย่างจากประชากรเป้าหมาย (ทุกคนในภาพยนตร์) คุณได้สุ่มตัวอย่างเฉพาะคนที่อยู่ในแถวหน้า อาจเป็นไปได้ว่าคนที่อยู่แถวหน้าสนใจภาพยนตร์เรื่องนั้นมากกว่าคนที่อยู่ในแถวอื่นๆ
  • อคติที่ไม่ตอบ: โดยทั่วไป ผู้ที่มีความคิดเห็นรุนแรงมักจะตอบแบบสอบถามที่ไม่บังคับบ่อยกว่าคนที่มีความคิดเห็นเล็กน้อย เนื่องจากแบบสำรวจภาพยนตร์เป็นแบบสำรวจที่ไม่บังคับ คำตอบจึงมีแนวโน้มที่จะสร้างการกระจายแบบ 2 โมดัลมากกว่าการแจกแจงแบบปกติ (รูปกระดิ่ง)

แอตทริบิวต์ที่ละเอียดอ่อน

#fairness
แอตทริบิวต์ของมนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษเนื่องจากเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนบุคคล

U

ไม่ทราบ (สำหรับแอตทริบิวต์ที่มีความละเอียดอ่อน)

#fairness

สถานการณ์ที่มีแอตทริบิวต์ที่มีความละเอียดอ่อน แต่ไม่ได้รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่มีความละเอียดอ่อนมักสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูลบุคคล โมเดลที่ฝึกโดยไม่รู้ตัวเกี่ยวกับแอตทริบิวต์ที่มีความละเอียดอ่อนจึงยังคงมีผลกระทบที่แตกต่างกันในส่วนที่เกี่ยวกับแอตทริบิวต์นั้น หรือละเมิดข้อจำกัดเกี่ยวกับความเป็นธรรมอื่นๆ