อภิธานศัพท์เกี่ยวกับแมชชีนเลิร์นนิง: ความเป็นธรรม

หน้านี้มีคําในอภิธานศัพท์เกี่ยวกับความเป็นธรรม สําหรับอภิธานศัพท์ทั้งหมด คลิกที่นี่

แอตทริบิวต์

#fairness

คําพ้องความหมายสําหรับ feature

ในความเป็นธรรมของแมชชีนเลิร์นนิง แอตทริบิวต์มักจะอ้างอิงถึงลักษณะเฉพาะที่เกี่ยวข้องกับตัวบุคคล

การให้น้ําหนักอัตโนมัติ

#fairness

เมื่อผู้มีอํานาจตัดสินใจสนับสนุนคําแนะนําของระบบการตัดสินใจอัตโนมัติมากกว่าข้อมูลที่ไม่มีการทํางานอัตโนมัติ แม้แต่เมื่อระบบการตัดสินใจอัตโนมัติทําผิดพลาด

อคติ (จริยธรรม/ความเป็นธรรม)

#fairness
#fundamentals

1. การเหมารวม อคติ หรือความชอบในบางสิ่ง บุคคล หรือกลุ่มบุคคลอื่นๆ การให้น้ําหนักพิเศษเหล่านี้อาจส่งผลกระทบต่อการรวบรวมและตีความข้อมูล การออกแบบระบบ และการโต้ตอบของผู้ใช้กับระบบ ประเภทของอคติประเภทนี้รวมถึง:

2. ข้อผิดพลาดที่เป็นระบบซึ่งได้จากการสุ่มตัวอย่างหรือขั้นตอนการรายงาน ประเภทของอคติประเภทนี้รวมถึง:

อย่าสับสนกับอคติในโมเดลแมชชีนเลิร์นนิงหรืออคติการคาดการณ์

การให้น้ําหนักพิเศษกับการยืนยัน

#fairness

แนวโน้มในการค้นหา ตีความ ทําเป็นความอ่อนไหว และทําให้นึกถึงข้อมูลในทางที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ของตน นักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิงอาจรวบรวมหรือติดป้ายกํากับข้อมูลโดยไม่ตั้งใจในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่ การให้น้ําหนักพิเศษการยืนยันคืออคติโดยนัย

อคติของผู้ทดสอบเป็นรูปแบบหนึ่งของการให้น้ําหนักพิเศษในการยืนยัน โดยที่ผู้ทดสอบจะฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่แล้ว

ความยุติธรรมในการต่อต้าน

#fairness
เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทสร้างผลลัพธ์เดียวกันกับบุคคลใดบุคคลหนึ่งสําหรับตัวแยกประเภทที่เหมือนกันหรือไม่ ยกเว้นในส่วนแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินตัวแยกประเภทสําหรับความเป็นธรรมในเชิงต่อต้านเป็นวิธีหนึ่งสําหรับการแสดงแหล่งที่มาที่เป็นไปได้ของการให้น้ําหนักพิเศษในโมเดล

ดู "When Worlds Collide: Ingegating Different Counterftrues Assumptions in Fairfair" เพื่อสนทนาเกี่ยวกับความเป็นธรรม ที่ละเอียดมากขึ้น

อคติที่ครอบคลุม

#fairness

โปรดดูการให้น้ําหนักการเลือก

ความเท่าเทียมตามข้อมูลประชากร

#fairness

เมตริกความเป็นธรรมที่น่าพอใจหากผลการจัดประเภทของโมเดลไม่ได้ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนที่ระบุ

ตัวอย่างเช่น หากทั้ง Lilliputian และ Brobdingnagians ใช้กับมหาวิทยาลัย Glubbdubdrib ความเท่าเทียมของกลุ่มประชากรจะสําเร็จก็ต่อเมื่อเปอร์เซ็นต์ของ Lilliputian ที่ได้รับการยอมรับเท่ากับเปอร์เซ็นต์ของกลุ่ม Brobdingnagians ที่ได้รับการยอมรับ ไม่ว่าจะมีกลุ่มหนึ่งที่มีคุณสมบัติสูงกว่าอีกกลุ่มหรือไม่

ตรงกันข้ามกับความน่าจะเป็นที่เท่าเทียมและความเท่าเทียมของโอกาส ซึ่งช่วยให้การแยกประเภทผลลัพธ์ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนได้ แต่ไม่อนุญาตให้มีผลการจัดประเภทสําหรับป้ายกํากับข้อมูลจากการสังเกตการณ์โดยตรงที่ระบุโดยอิงตามแอตทริบิวต์ที่มีความละเอียดอ่อน ดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ฉลาดขึ้น" สําหรับการจําลองแบบ เพื่อให้เห็นภาพข้อดีข้อเสียของการเพิ่มประสิทธิภาพด้านข้อมูลประชากร

ผลกระทบจากหลายส่วน

#fairness

การตัดสินใจเกี่ยวกับผู้คนที่ส่งผลต่อประชากร กลุ่มต่างๆ ในสัดส่วนที่ไม่เหมาะสม ซึ่งมักจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจทางอัลกอริทึมเป็นอันตรายหรือเป็นประโยชน์กับกลุ่มย่อยบางกลุ่มมากกว่ากรณีอื่นๆ

ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่กําหนดการมีสิทธิ์ของสินเชื่อบ้านแบบ Lilliputian มีแนวโน้มที่จะจัดประเภทเป็น "ไม่มีสิทธิ์" หากที่อยู่ทางไปรษณีย์ของรหัสไปรษณีย์หนึ่งมีรหัสไปรษณีย์บางอย่างอยู่ หาก Lilliputian ชาว Big-Endian มีแนวโน้มที่จะมีที่อยู่ทางไปรษณีย์ที่มีรหัสไปรษณีย์มากกว่า Little-Endian Lilliputians อัลกอริทึมนี้อาจทําให้เกิดผลกระทบที่แตกต่างออกไป

ตรงกันข้ามกับการดูแลแยกอิสระ ซึ่งเน้นไปที่ความไม่สอดคล้องที่เป็นผลจากลักษณะของกลุ่มย่อย เป็นอินพุตที่ชัดแจ้งต่อกระบวนการตัดสินใจโดยใช้อัลกอริทึม

การดูแลที่แตกต่างกัน

#fairness

การแยกแอตทริบิวต์ที่มีความละเอียดอ่อนของตัวแบบเข้าไปในกระบวนการตัดสินใจโดยใช้อัลกอริทึมเพื่อให้แต่ละกลุ่มได้รับการปฏิบัติที่ไม่เหมือนกัน

เช่น พิจารณาอัลกอริทึมที่ตัดสินการมีสิทธิ์ของบ้านจําลองของ Lilliputian โดยอิงตามข้อมูลที่พวกเขาให้ไว้ในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้ความเกี่ยวข้องระหว่าง Lilitian เป็น Big-Endian หรือ Little-Endian เป็นอินพุต ก็จะเป็นการกระตุ้นให้เกิดการปฏิบัติที่แตกต่างกันตามมิติข้อมูลนั้น

ซึ่งตรงกันข้ามกับผลกระทบที่แตกต่างกัน ซึ่งเน้นไปที่ความแตกต่างในผลกระทบทางสังคมของการตัดสินใจด้านอัลกอริทึมที่มีต่อกลุ่มย่อยไม่ว่ากลุ่มย่อยจะเป็นอินพุตของโมเดลหรือไม่ก็ตาม

ความเท่าเทียมของโอกาส

#fairness
เมตริกความเป็นธรรมจะตรวจสอบว่าป้ายกํากับหนึ่งๆ (ซึ่งเป็นข้อดีหรือข้อเสียของบุคคลหนึ่งๆ) ถูกต้องหรือไม่ และมีแอตทริบิวต์ตัวแยกประเภทจะคาดการณ์ป้ายกํากับที่ต้องการได้ดีเท่าๆ กันสําหรับค่าของแอตทริบิวต์นั้นทั้งหมด กล่าวอีกนัยหนึ่งคือ ความเท่าเทียมของโอกาสจะวัดว่า ผู้คนที่ควรมีคุณสมบัติเข้าเกณฑ์จะมีโอกาสเท่าๆ กัน ที่จะทําเช่นนั้นหรือไม่ โดยไม่คํานึงถึงการเป็นสมาชิกกลุ่ม

ตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians ไปเป็นโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาตอนต้นของลิลลีเทียนมีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนมากมีคุณสมบัติในการเข้าเรียนในมหาวิทยาลัย โรงเรียนมัธยมต้นของ Brobdingnagians ไม่มีชั้นเรียนคณิตศาสตร์เลย และผลก็คือนักเรียนที่มีคุณสมบัติต่ํากว่ามาก ความเท่าเทียมของโอกาสเป็นที่พึงพอใจกับป้ายกํากับ "ยอมรับ" ที่เป็นสัญชาติ (Lilliputian หรือ Brobdingnagian) หากนักเรียนที่มีคุณสมบัติเหมาะสมจะได้รับการยอมรับอย่างเท่าเทียมกันโดยไม่คํานึงว่าจะเป็น Lilliputian หรือ Brobdingnagian

ตัวอย่างเช่น สมมติว่ามีชาว Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วม มหาวิทยาลัย Glubbdubdrib และการตัดสินการสมัครเรียนมีดังต่อไปนี้

ตารางที่ 1 ผู้สมัครชาวลิลลีเชียน (90% คือผู้ผ่านการรับรอง)

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 45 3
ปฏิเสธแล้ว 45 7
รวม 90 10
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 45/90 = 50%
เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 7/10 = 70%
เปอร์เซ็นต์รวมของนักเรียนจาก Lilliputian: 45+3)/100 = 48%

 

ตารางที่ 2 ผู้สมัคร Brobdingnagian (10% คือคุณสมบัติ):

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 5 9
ปฏิเสธแล้ว 5 81
รวม 10 90
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 5/10 = 50%
เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 81/90 = 90%
เปอร์เซ็นต์รวมของนักเรียนที่รับ Brobdingnagian: (5+9)/100 = 14%

ตัวอย่างก่อนหน้านี้เห็นด้วยกับความเท่าเทียมของการยอมรับ นักเรียนที่มีคุณสมบัติตามเกณฑ์ เพราะทั้ง Lilliputian และที่มีคุณสมบัติเป็น Brobdingnagians จะมีโอกาส 50% ที่จะได้รับการยอมรับ

โปรดดู "ความเท่าเทียม ในการเรียนรู้ภายใต้การควบคุมดูแล" สําหรับการพูดคุยอย่างละเอียดเกี่ยวกับโอกาสแห่งความเท่าเทียม นอกจากนี้ คุณยังดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ฉลาดขึ้น" เพื่อแสดงให้เห็นภาพลักษณ์ซึ่งจะสร้างความได้เปรียบเมื่อเพิ่มประสิทธิภาพเพื่อโอกาสที่เท่าเทียม

ความน่าจะเป็นที่เท่ากัน

#fairness
เมตริกความเป็นธรรมที่ตรวจสอบว่าป้ายกํากับและแอตทริบิวต์รายการใดรายการหนึ่งคาดการณ์ป้ายกํากับนั้นได้ดีเท่ากันสําหรับค่าทั้งหมดในแอตทริบิวต์นั้น

ตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians ไปเป็นโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาตอนต้นของลิลลิเตียนมีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนใหญ่มีคุณสมบัติสําหรับหลักสูตรมหาวิทยาลัย โรงเรียนมัธยมต้นของ Brobdingnagians ไม่มีชั้นเรียนคณิตศาสตร์เลย และผลก็คือนักเรียนมีจํานวนน้อยลง โอกาสที่เท่าเทียมนั้นไม่เป็นที่น่าพอใจไม่ว่าผู้สมัครจะเป็น Lilliputian หรือ Brobdingnagian ก็ตาม หากมีคุณสมบัติผ่านเกณฑ์ ก็มีแนวโน้มที่จะได้รับการยอมรับให้เข้าร่วมโปรแกรมเท่าที่จะเป็นไปได้ และหากพวกเขาไม่มีคุณสมบัติก็มีแนวโน้มที่จะถูกปฏิเสธเช่นเดียวกัน

สมมติว่ามีชาว Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วม Glubbdubdrib มหาวิทยาลัย และข้อมูลที่ผ่านการคัดเลือกมีดังนี้

ตารางที่ 3 ผู้สมัครชาวลิลลีเชียน (90% คือผู้ผ่านการรับรอง)

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 45 2
ปฏิเสธแล้ว 45 8
รวม 90 10
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 45/90 = 50%
เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 8/10 = 80%
เปอร์เซ็นต์รวมของนักเรียนจาก Lilliputian: 45+2)/100 = 47%

 

ตารางที่ 4 ผู้สมัคร Brobdingnagian (10% คือคุณสมบัติ):

  เข้าเกณฑ์ คุณสมบัติไม่ครบ
ยอมรับ 5 18
ปฏิเสธแล้ว 5 72
รวม 10 90
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 5/10 = 50%
เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 72/90 = 80%
เปอร์เซ็นต์รวมของนักเรียนที่รับ Brobdingnagian: (5+18)/100 = 23%

โอกาสยิ่งเท่าๆ กันเป็นที่น่าพอใจเพราะทั้งนักเรียนแบบ Lilliputian และ Brobdingnagian ที่เหมาะสมมีโอกาส 50% ที่จะเข้าเรียนได้

โอกาสที่เท่าๆ กันจะถูกกําหนดอย่างเป็นทางการใน "ความเสมอภาคของโอกาสในการเรียนรู้ภายใต้การดูแล" ดังนี้ "การคาดการณ์ π สอดคล้องกับความน่าจะเป็นที่เท่ากันที่เกี่ยวข้องกับแอตทริบิวต์ A ที่ได้รับการคุ้มครองและผลลัพธ์ Y หาก Ŷ และ A เป็นอิสระที่มีเงื่อนไขใน Y"

อคติของผู้ทดลอง

#fairness

โปรดดูการให้น้ําหนักพิเศษในการยืนยัน

F

ข้อจํากัดความเป็นธรรม

#fairness
การใช้ข้อจํากัดกับอัลกอริทึมเพื่อให้เป็นไปตาม คําจํากัดความความยุติธรรมอย่างน้อย 1 ข้อ ตัวอย่างข้อจํากัดของความเป็นธรรม ได้แก่

เมตริกความเป็นธรรม

#fairness

คําจํากัดความทางคณิตศาสตร์ว่าด้วย "ความเป็นธรรม" ที่สามารถวัดได้ เมตริกด้านความเป็นธรรมที่ใช้บ่อยบางส่วนได้แก่

เมตริกความยุติธรรมหลายรายการไม่เกี่ยวข้องกัน ดูความไม่เข้ากันของเมตริกความเป็นธรรม

G

การระบุแหล่งที่มาของกลุ่ม

#fairness

แล้วสมมติว่าจริงๆ แล้วสําหรับแต่ละคน ในกลุ่มก็เหมือนกัน ผลของอคติที่มีต่อการระบุแหล่งที่มาอาจสูงขึ้นได้หากใช้การสุ่มตัวอย่างแบบตามสะดวกในการรวบรวมข้อมูล ในตัวอย่างที่ไม่ได้เป็นตัวแทน อาจมีการระบุแหล่งที่มา ที่ไม่ได้สะท้อนถึงความเป็นจริง

โปรดดูการให้น้ําหนักพิเศษกับกลุ่มเดียวกันและอคติในกลุ่ม

I

อคติทางอ้อม

#fairness

การเชื่อมโยงหรือสมมติฐานโดยอัตโนมัติตามโมเดลทางความคิดและความทรงจําของบุคคล อคติโดยนัยมีผลกระทบดังต่อไปนี้

  • วิธีการรวบรวมและแยกประเภทข้อมูล
  • วิธีการออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง

ตัวอย่างเช่น เมื่อสร้างตัวแยกประเภทเพื่อระบุรูปภาพงานแต่งงาน วิศวกรอาจใช้ชุดเดรสสีขาวในรูปภาพเป็นจุดสนใจ อย่างไรก็ตาม ชุดเดรสสีขาวเป็นประเพณีของบางยุคสมัย และบางวัฒนธรรมเท่านั้น

โปรดดูการให้น้ําหนักพิเศษในการยืนยัน

ความไม่เข้ากันของเมตริกความเป็นธรรม

#fairness

ความคิดที่ว่าความยุติธรรมบางอย่างเข้ากันไม่ได้และตอบสนองพร้อมกันไม่ได้ ผลที่ได้คือไม่มีเมตริกสากลเดียวสําหรับการวัดค่าความเป็นธรรมที่นําไปใช้กับปัญหา ML ทั้งหมดได้

ถึงแม้นี่อาจจะเป็นการสนับสนุน แต่เมตริกความยุติธรรมนั้นไม่ต่างกัน แต่เป็นการชี้ขาดว่าจะต้องมีการกําหนดประเด็นความเป็นธรรมตามบริบทสําหรับปัญหา ML ดังกล่าว โดยมีเป้าหมายในการป้องกันอันตรายที่เกี่ยวข้องกับ Use Case เฉพาะ

ดู "เกี่ยวกับความเป็นไปของความเป็นธรรม" สําหรับรายละเอียดเพิ่มเติมเกี่ยวกับหัวข้อนี้

ความเป็นธรรมของบุคคลธรรมดา

#fairness

เมตริกความเป็นธรรมที่ตรวจสอบว่าบุคคลที่คล้ายคลึงกันได้รับการจัดประเภทในลักษณะเดียวกันหรือไม่ ตัวอย่างเช่น Brobdingnagian Academy อาจต้องการให้เป็นไปตาม ความเป็นธรรมของแต่ละคนโดยดูแลให้นักเรียน 2 คนที่มีคะแนนเท่ากันและคะแนนสอบมาตรฐานเท่าๆ กันมีโอกาสเข้าเรียนได้เท่ากัน

โปรดทราบว่าความยุติธรรมของแต่ละบุคคลขึ้นอยู่กับวิธีที่คุณกําหนดว่า "ความคล้ายคลึงกัน" (ในกรณีนี้คือคะแนนและคะแนนสอบ) คุณอาจเสี่ยงที่จะแนะนําปัญหาความเป็นธรรมใหม่หากเมตริกความคล้ายคลึงของคุณขาดข้อมูลที่สําคัญ (เช่น หลักสูตรความเข้มงวดของนักเรียน)

ดู "Fairness Through Awareness" เพื่อสนทนาเกี่ยวกับความเป็นธรรมโดยละเอียดเพิ่มเติม

อคติในกลุ่ม

#fairness

การแสดงบางส่วนของกลุ่มหรือลักษณะของตนเอง หากผู้ทดสอบหรือผู้ประเมินประกอบไปด้วยเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิง อคติของกลุ่มอาจทําให้การทดสอบผลิตภัณฑ์หรือชุดข้อมูลไม่ถูกต้อง

การให้น้ําหนักพิเศษในกลุ่มคือ รูปแบบหนึ่งของการให้น้ําหนักที่มาของกลุ่ม โปรดดูการให้น้ําหนักพิเศษที่เหมือนกันสําหรับกลุ่มนอกกลุ่ม

N

การให้น้ําหนักพิเศษกับคําตอบ

#fairness

โปรดดูการให้น้ําหนักการเลือก

O

ความเอนเอียงของกลุ่มภายนอก

#fairness

แนวโน้มที่คุณจะเห็นสมาชิกนอกกลุ่มเหมือนกับสมาชิกกลุ่มมากกว่าเมื่อเทียบกับทัศนคติ ค่านิยม ลักษณะเฉพาะ และบุคลิกลักษณะอื่นๆ ในกลุ่มหมายถึงคนที่คุณโต้ตอบด้วยเป็นประจํา กลุ่มหมายถึงคนที่คุณไม่ได้โต้ตอบด้วยเป็นประจํา หากคุณสร้างชุดข้อมูลด้วยการขอให้ผู้คนระบุแอตทริบิวต์เกี่ยวกับกลุ่ม แอตทริบิวต์เหล่านั้นอาจมีความแตกต่างกันเพียงเล็กน้อยและเป็นแบบเหมารวมมากกว่าแอตทริบิวต์ที่ผู้เข้าร่วมแสดงเป็นคนในกลุ่ม

ตัวอย่างเช่น Lilliputians อาจอธิบายถึงบ้านของ Lilliputian คนอื่นๆ โดยมีรายละเอียดที่บ่งบอกถึงความแตกต่างเล็กๆ น้อยๆ ในสไตล์สถาปัตยกรรม หน้าต่าง ประตู และขนาด อย่างไรก็ตาม พวกลิลเลียนเตียนตัวเดิมอาจประกาศว่า เจ้า Robbdingnagians ตัวจริงอาศัยอยู่ในบ้านหลังเดียวกัน

การให้น้ําหนักพิเศษร่วมกันเป็นกลุ่มเป็นหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม

ดูอคติในกลุ่ม

P

การให้น้ําหนักพิเศษกับการเข้าร่วม

#fairness

คําพ้องของอคติที่ไม่ตอบกลับ โปรดดูการให้น้ําหนักการเลือก

หลังการประมวลผล

#fairness
#fundamentals

การปรับเอาต์พุตของโมเดลหลังจากที่เรียกใช้โมเดลแล้ว หลังการประมวลผลยังใช้เพื่อบังคับข้อจํากัดด้านความเป็นธรรมได้โดยไม่ต้องแก้ไขโมเดลเอง

เช่น นําขั้นตอนหลังการประมวลผลไปใช้กับตัวแยกประเภทไบนารีโดยการตั้งค่าเกณฑ์การจัดประเภทเพื่อให้ความเท่าเทียมของโอกาสได้รับการรักษาสําหรับบางแอตทริบิวต์ โดยตรวจสอบว่าอัตราผลบวกจริงเท่ากันสําหรับค่าทั้งหมดของแอตทริบิวต์นั้น

ความเท่าเทียมของการคาดการณ์

#fairness

เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทที่ระบุมีอัตราการกําหนด เทียบเท่าสําหรับกลุ่มย่อยที่อยู่ระหว่างการพิจารณาหรือไม่

ตัวอย่างเช่น โมเดลที่คาดคะเนว่าระดับที่ยอมรับในมหาวิทยาลัยจะมีความเสมอภาคของความเสมอต้นเสมอปลายสําหรับสัญชาติ หากอัตราความแม่นยําเท่ากันสําหรับ Lilliputian และ Brobdingnagians

บางครั้งความคล้ายคลึงของการคาดการณ์เรียกอีกอย่างว่าความเท่าเทียมของอัตราการคาดการณ์

ดู "คําอธิบายเกี่ยวกับหลักความเป็นธรรม" (ส่วนที่ 3.2.1) สําหรับข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับความคล้ายคลึงกันของการคาดการณ์

ความคล้ายคลึงของอัตราการคาดการณ์

#fairness

อีกชื่อหนึ่งของความคล้ายคลึงกันของการคาดการณ์

การประมวลผลล่วงหน้า

#fairness
การประมวลผลข้อมูลก่อนที่จะใช้เพื่อฝึกโมเดล การประมวลผลล่วงหน้านั้นง่ายพอๆ กับการนําคําออกจากคลังข้อมูลข้อความภาษาอังกฤษที่ไม่มีอยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจเป็นความซับซ้อนเหมือนการแสดงจุดข้อมูลในลักษณะที่กําจัดแอตทริบิวต์ที่สัมพันธ์กับแอตทริบิวต์ที่ละเอียดอ่อนให้ได้มากที่สุด การประมวลผลล่วงหน้าช่วยให้คุณปฏิบัติตามข้อจํากัดของความเป็นธรรมได้

พร็อกซี (แอตทริบิวต์ที่ละเอียดอ่อน)

#fairness
แอตทริบิวต์ที่ใช้เป็นแบบสแตนด์อโลนสําหรับแอตทริบิวต์ที่มีความละเอียดอ่อน เช่น รหัสไปรษณีย์อาจเป็นตัวระบุรายได้ เชื้อชาติ หรือชาติพันธุ์

ขวา

การรายงานการให้น้ําหนัก

#fairness

ข้อเท็จจริงที่ว่าความถี่ที่ผู้คนเขียนเกี่ยวกับการกระทํา สิ่งที่มาหรือทรัพย์สินไม่ได้สะท้อนถึงความถี่ในชีวิตจริง หรือระดับพร็อพเพอร์ตี้เป็นลักษณะของบุคคลหนึ่งๆ การให้น้ําหนักการรายงานอาจมีผลต่อองค์ประกอบ ข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้

ตัวอย่างเช่น ในหนังสือ คําว่า หัวเราะ แพร่หลายกว่าการหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่ของการหัวเราะ และการหายใจจากคลังข้อมูลหนังสืออาจชี้ว่า การหัวเราะมักเกิดขึ้นจากการหายใจ

S

การให้น้ําหนักตัวอย่าง

#fairness

โปรดดูการให้น้ําหนักการเลือก

การให้น้ําหนักการเลือก

#fairness

ข้อผิดพลาดในการสรุปที่ได้จากข้อมูลตัวอย่างเนื่องจากกระบวนการคัดเลือกที่ก่อให้เกิดความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตได้ในข้อมูลกับที่สังเกตไม่ได้ อคติการคัดเลือกรูปแบบต่อไปนี้มีอยู่:

  • การให้น้ําหนักตัวอย่าง: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับกลุ่มประชากรที่โมเดลแมชชีนเลิร์นนิงกําลังคาดการณ์
  • การให้น้ําหนักตัวอย่าง: ระบบจะไม่เก็บรวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
  • อคติที่ไม่ตอบกลับ (หรือที่เรียกว่าการให้น้ําหนักการมีส่วนร่วม): ผู้ใช้จากบางกลุ่มเลือกไม่ใช้แบบสํารวจในอัตราที่แตกต่างจากผู้ใช้จากกลุ่มอื่นๆ

ตัวอย่างเช่น สมมติว่าคุณสร้างโมเดลแมชชีนเลิร์นนิง ที่คาดคะเนความเพลิดเพลินของภาพยนตร์ ในการรวบรวมข้อมูลการฝึก ให้ส่งแบบสํารวจให้กับทุกคนที่แถวหน้าของโรงภาพยนตร์ซึ่งแสดงภาพยนตร์ อาจดูเหมือนเป็นวิธีการที่เหมาะสมในการรวบรวมชุดข้อมูล แต่การรวบรวมข้อมูลรูปแบบนี้อาจเริ่มใช้อคติการเลือกในรูปแบบต่อไปนี้

  • อคติโดยการสุ่มตัวอย่าง: การสุ่มตัวอย่างจากกลุ่มประชากรที่เลือกที่จะดูหนัง การคาดคะเนของนายแบบ/นายแบบอาจไม่สื่อถึงผู้คนที่ยังไม่ได้แสดงความสนใจในระดับนั้นในภาพยนตร์เสมอไป
  • การให้น้ําหนักตัวอย่าง: แทนที่จะใช้การสุ่มตัวอย่างจากประชากรเป้าหมาย (ผู้ใช้ทั้งหมดในภาพยนตร์) คุณจะต้องสุ่มตัวอย่างเฉพาะคนที่อยู่แถวหน้าเท่านั้น อาจเป็นไปได้ว่าผู้คนที่อยู่ในแถวหน้าสนใจภาพยนตร์มากกว่าแถวอื่นๆ
  • การมีอคติที่ไม่ได้ตอบกลับ: โดยทั่วไป ผู้ที่มีความคิดเห็นที่ชัดเจนมักตอบสนองต่อแบบสํารวจที่ไม่บังคับบ่อยกว่าผู้ที่แสดงความคิดเห็นเพียงเล็กน้อย เนื่องจากการสํารวจภาพยนตร์เป็นแบบไม่บังคับ คําตอบจึงมีแนวโน้มที่จะทําให้เกิดการกระจายแบบโมดัลมากกว่าการกระจายแบบปกติ (รูประฆัง)

แอตทริบิวต์ที่ละเอียดอ่อน

#fairness
แอตทริบิวต์มนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษด้วยเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนตัว

U

ไม่ทราบ (สําหรับแอตทริบิวต์ที่ละเอียดอ่อน)

#fairness

สถานการณ์ที่แอตทริบิวต์ที่ละเอียดอ่อนมีอยู่ แต่ไม่รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่มีความละเอียดอ่อนมักจะสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูลของบุคคลหนึ่ง โมเดลที่ผ่านการฝึกโดยไม่รู้ตัวเกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนอาจยังคงมีผลกระทบที่แตกต่างกันเกี่ยวกับแอตทริบิวต์ดังกล่าว หรือละเมิดข้อจํากัดด้านความเป็นธรรมอื่นๆ