หน้านี้มีคําในอภิธานศัพท์เกี่ยวกับความเป็นธรรม สําหรับอภิธานศัพท์ทั้งหมด คลิกที่นี่
ก
แอตทริบิวต์
คําพ้องความหมายสําหรับ feature
ในความเป็นธรรมของแมชชีนเลิร์นนิง แอตทริบิวต์มักจะอ้างอิงถึงลักษณะเฉพาะที่เกี่ยวข้องกับตัวบุคคล
การให้น้ําหนักอัตโนมัติ
เมื่อผู้มีอํานาจตัดสินใจสนับสนุนคําแนะนําของระบบการตัดสินใจอัตโนมัติมากกว่าข้อมูลที่ไม่มีการทํางานอัตโนมัติ แม้แต่เมื่อระบบการตัดสินใจอัตโนมัติทําผิดพลาด
ข
อคติ (จริยธรรม/ความเป็นธรรม)
1. การเหมารวม อคติ หรือความชอบในบางสิ่ง บุคคล หรือกลุ่มบุคคลอื่นๆ การให้น้ําหนักพิเศษเหล่านี้อาจส่งผลกระทบต่อการรวบรวมและตีความข้อมูล การออกแบบระบบ และการโต้ตอบของผู้ใช้กับระบบ ประเภทของอคติประเภทนี้รวมถึง:
- การให้น้ําหนักอัตโนมัติ
- การให้น้ําหนักพิเศษในการยืนยัน
- การให้น้ําหนักพิเศษของผู้ทดสอบ
- การให้น้ําหนักการระบุแหล่งที่มาของกลุ่ม
- อคติแฝง
- อคติในกลุ่ม
- ความเอนเอียงในการจัดกลุ่มนอกกลุ่ม
2. ข้อผิดพลาดที่เป็นระบบซึ่งได้จากการสุ่มตัวอย่างหรือขั้นตอนการรายงาน ประเภทของอคติประเภทนี้รวมถึง:
- การครอบคลุมของความครอบคลุม
- อคติที่ไม่ตอบกลับ
- การให้น้ําหนักการมีส่วนร่วม
- การให้น้ําหนักพิเศษกับการรายงาน
- การให้น้ําหนักพิเศษจากการสุ่มตัวอย่าง
- อคติในการเลือก
อย่าสับสนกับอคติในโมเดลแมชชีนเลิร์นนิงหรืออคติการคาดการณ์
ค
การให้น้ําหนักพิเศษกับการยืนยัน
แนวโน้มในการค้นหา ตีความ ทําเป็นความอ่อนไหว และทําให้นึกถึงข้อมูลในทางที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ของตน นักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิงอาจรวบรวมหรือติดป้ายกํากับข้อมูลโดยไม่ตั้งใจในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่ การให้น้ําหนักพิเศษการยืนยันคืออคติโดยนัย
อคติของผู้ทดสอบเป็นรูปแบบหนึ่งของการให้น้ําหนักพิเศษในการยืนยัน โดยที่ผู้ทดสอบจะฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่แล้ว
ความยุติธรรมในการต่อต้าน
เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทสร้างผลลัพธ์เดียวกันกับบุคคลใดบุคคลหนึ่งสําหรับตัวแยกประเภทที่เหมือนกันหรือไม่ ยกเว้นในส่วนแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินตัวแยกประเภทสําหรับความเป็นธรรมในเชิงต่อต้านเป็นวิธีหนึ่งสําหรับการแสดงแหล่งที่มาที่เป็นไปได้ของการให้น้ําหนักพิเศษในโมเดลดู "When Worlds Collide: Ingegating Different Counterftrues Assumptions in Fairfair" เพื่อสนทนาเกี่ยวกับความเป็นธรรม ที่ละเอียดมากขึ้น
อคติที่ครอบคลุม
โปรดดูการให้น้ําหนักการเลือก
ง
ความเท่าเทียมตามข้อมูลประชากร
เมตริกความเป็นธรรมที่น่าพอใจหากผลการจัดประเภทของโมเดลไม่ได้ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนที่ระบุ
ตัวอย่างเช่น หากทั้ง Lilliputian และ Brobdingnagians ใช้กับมหาวิทยาลัย Glubbdubdrib ความเท่าเทียมของกลุ่มประชากรจะสําเร็จก็ต่อเมื่อเปอร์เซ็นต์ของ Lilliputian ที่ได้รับการยอมรับเท่ากับเปอร์เซ็นต์ของกลุ่ม Brobdingnagians ที่ได้รับการยอมรับ ไม่ว่าจะมีกลุ่มหนึ่งที่มีคุณสมบัติสูงกว่าอีกกลุ่มหรือไม่
ตรงกันข้ามกับความน่าจะเป็นที่เท่าเทียมและความเท่าเทียมของโอกาส ซึ่งช่วยให้การแยกประเภทผลลัพธ์ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนได้ แต่ไม่อนุญาตให้มีผลการจัดประเภทสําหรับป้ายกํากับข้อมูลจากการสังเกตการณ์โดยตรงที่ระบุโดยอิงตามแอตทริบิวต์ที่มีความละเอียดอ่อน ดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ฉลาดขึ้น" สําหรับการจําลองแบบ เพื่อให้เห็นภาพข้อดีข้อเสียของการเพิ่มประสิทธิภาพด้านข้อมูลประชากร
ผลกระทบจากหลายส่วน
การตัดสินใจเกี่ยวกับผู้คนที่ส่งผลต่อประชากร กลุ่มต่างๆ ในสัดส่วนที่ไม่เหมาะสม ซึ่งมักจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจทางอัลกอริทึมเป็นอันตรายหรือเป็นประโยชน์กับกลุ่มย่อยบางกลุ่มมากกว่ากรณีอื่นๆ
ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่กําหนดการมีสิทธิ์ของสินเชื่อบ้านแบบ Lilliputian มีแนวโน้มที่จะจัดประเภทเป็น "ไม่มีสิทธิ์" หากที่อยู่ทางไปรษณีย์ของรหัสไปรษณีย์หนึ่งมีรหัสไปรษณีย์บางอย่างอยู่ หาก Lilliputian ชาว Big-Endian มีแนวโน้มที่จะมีที่อยู่ทางไปรษณีย์ที่มีรหัสไปรษณีย์มากกว่า Little-Endian Lilliputians อัลกอริทึมนี้อาจทําให้เกิดผลกระทบที่แตกต่างออกไป
ตรงกันข้ามกับการดูแลแยกอิสระ ซึ่งเน้นไปที่ความไม่สอดคล้องที่เป็นผลจากลักษณะของกลุ่มย่อย เป็นอินพุตที่ชัดแจ้งต่อกระบวนการตัดสินใจโดยใช้อัลกอริทึม
การดูแลที่แตกต่างกัน
การแยกแอตทริบิวต์ที่มีความละเอียดอ่อนของตัวแบบเข้าไปในกระบวนการตัดสินใจโดยใช้อัลกอริทึมเพื่อให้แต่ละกลุ่มได้รับการปฏิบัติที่ไม่เหมือนกัน
เช่น พิจารณาอัลกอริทึมที่ตัดสินการมีสิทธิ์ของบ้านจําลองของ Lilliputian โดยอิงตามข้อมูลที่พวกเขาให้ไว้ในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้ความเกี่ยวข้องระหว่าง Lilitian เป็น Big-Endian หรือ Little-Endian เป็นอินพุต ก็จะเป็นการกระตุ้นให้เกิดการปฏิบัติที่แตกต่างกันตามมิติข้อมูลนั้น
ซึ่งตรงกันข้ามกับผลกระทบที่แตกต่างกัน ซึ่งเน้นไปที่ความแตกต่างในผลกระทบทางสังคมของการตัดสินใจด้านอัลกอริทึมที่มีต่อกลุ่มย่อยไม่ว่ากลุ่มย่อยจะเป็นอินพุตของโมเดลหรือไม่ก็ตาม
จ
ความเท่าเทียมของโอกาส
เมตริกความเป็นธรรมจะตรวจสอบว่าป้ายกํากับหนึ่งๆ (ซึ่งเป็นข้อดีหรือข้อเสียของบุคคลหนึ่งๆ) ถูกต้องหรือไม่ และมีแอตทริบิวต์ตัวแยกประเภทจะคาดการณ์ป้ายกํากับที่ต้องการได้ดีเท่าๆ กันสําหรับค่าของแอตทริบิวต์นั้นทั้งหมด กล่าวอีกนัยหนึ่งคือ ความเท่าเทียมของโอกาสจะวัดว่า ผู้คนที่ควรมีคุณสมบัติเข้าเกณฑ์จะมีโอกาสเท่าๆ กัน ที่จะทําเช่นนั้นหรือไม่ โดยไม่คํานึงถึงการเป็นสมาชิกกลุ่มตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians ไปเป็นโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาตอนต้นของลิลลีเทียนมีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนมากมีคุณสมบัติในการเข้าเรียนในมหาวิทยาลัย โรงเรียนมัธยมต้นของ Brobdingnagians ไม่มีชั้นเรียนคณิตศาสตร์เลย และผลก็คือนักเรียนที่มีคุณสมบัติต่ํากว่ามาก ความเท่าเทียมของโอกาสเป็นที่พึงพอใจกับป้ายกํากับ "ยอมรับ" ที่เป็นสัญชาติ (Lilliputian หรือ Brobdingnagian) หากนักเรียนที่มีคุณสมบัติเหมาะสมจะได้รับการยอมรับอย่างเท่าเทียมกันโดยไม่คํานึงว่าจะเป็น Lilliputian หรือ Brobdingnagian
ตัวอย่างเช่น สมมติว่ามีชาว Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วม มหาวิทยาลัย Glubbdubdrib และการตัดสินการสมัครเรียนมีดังต่อไปนี้
ตารางที่ 1 ผู้สมัครชาวลิลลีเชียน (90% คือผู้ผ่านการรับรอง)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 3 |
ปฏิเสธแล้ว | 45 | 7 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 7/10 = 70% เปอร์เซ็นต์รวมของนักเรียนจาก Lilliputian: 45+3)/100 = 48% |
ตารางที่ 2 ผู้สมัคร Brobdingnagian (10% คือคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 9 |
ปฏิเสธแล้ว | 5 | 81 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 81/90 = 90% เปอร์เซ็นต์รวมของนักเรียนที่รับ Brobdingnagian: (5+9)/100 = 14% |
ตัวอย่างก่อนหน้านี้เห็นด้วยกับความเท่าเทียมของการยอมรับ นักเรียนที่มีคุณสมบัติตามเกณฑ์ เพราะทั้ง Lilliputian และที่มีคุณสมบัติเป็น Brobdingnagians จะมีโอกาส 50% ที่จะได้รับการยอมรับ
โปรดดู "ความเท่าเทียม ในการเรียนรู้ภายใต้การควบคุมดูแล" สําหรับการพูดคุยอย่างละเอียดเกี่ยวกับโอกาสแห่งความเท่าเทียม นอกจากนี้ คุณยังดู "การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ฉลาดขึ้น" เพื่อแสดงให้เห็นภาพลักษณ์ซึ่งจะสร้างความได้เปรียบเมื่อเพิ่มประสิทธิภาพเพื่อโอกาสที่เท่าเทียม
ความน่าจะเป็นที่เท่ากัน
เมตริกความเป็นธรรมที่ตรวจสอบว่าป้ายกํากับและแอตทริบิวต์รายการใดรายการหนึ่งคาดการณ์ป้ายกํากับนั้นได้ดีเท่ากันสําหรับค่าทั้งหมดในแอตทริบิวต์นั้นตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputians และ Brobdingnagians ไปเป็นโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาตอนต้นของลิลลิเตียนมีหลักสูตรวิชาคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนใหญ่มีคุณสมบัติสําหรับหลักสูตรมหาวิทยาลัย โรงเรียนมัธยมต้นของ Brobdingnagians ไม่มีชั้นเรียนคณิตศาสตร์เลย และผลก็คือนักเรียนมีจํานวนน้อยลง โอกาสที่เท่าเทียมนั้นไม่เป็นที่น่าพอใจไม่ว่าผู้สมัครจะเป็น Lilliputian หรือ Brobdingnagian ก็ตาม หากมีคุณสมบัติผ่านเกณฑ์ ก็มีแนวโน้มที่จะได้รับการยอมรับให้เข้าร่วมโปรแกรมเท่าที่จะเป็นไปได้ และหากพวกเขาไม่มีคุณสมบัติก็มีแนวโน้มที่จะถูกปฏิเสธเช่นเดียวกัน
สมมติว่ามีชาว Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วม Glubbdubdrib มหาวิทยาลัย และข้อมูลที่ผ่านการคัดเลือกมีดังนี้
ตารางที่ 3 ผู้สมัครชาวลิลลีเชียน (90% คือผู้ผ่านการรับรอง)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 45 | 2 |
ปฏิเสธแล้ว | 45 | 8 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 8/10 = 80% เปอร์เซ็นต์รวมของนักเรียนจาก Lilliputian: 45+2)/100 = 47% |
ตารางที่ 4 ผู้สมัคร Brobdingnagian (10% คือคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับ | 5 | 18 |
ปฏิเสธแล้ว | 5 | 72 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่รับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 72/90 = 80% เปอร์เซ็นต์รวมของนักเรียนที่รับ Brobdingnagian: (5+18)/100 = 23% |
โอกาสยิ่งเท่าๆ กันเป็นที่น่าพอใจเพราะทั้งนักเรียนแบบ Lilliputian และ Brobdingnagian ที่เหมาะสมมีโอกาส 50% ที่จะเข้าเรียนได้
โอกาสที่เท่าๆ กันจะถูกกําหนดอย่างเป็นทางการใน "ความเสมอภาคของโอกาสในการเรียนรู้ภายใต้การดูแล" ดังนี้ "การคาดการณ์ π สอดคล้องกับความน่าจะเป็นที่เท่ากันที่เกี่ยวข้องกับแอตทริบิวต์ A ที่ได้รับการคุ้มครองและผลลัพธ์ Y หาก Ŷ และ A เป็นอิสระที่มีเงื่อนไขใน Y"
อคติของผู้ทดลอง
โปรดดูการให้น้ําหนักพิเศษในการยืนยัน
F
ข้อจํากัดความเป็นธรรม
การใช้ข้อจํากัดกับอัลกอริทึมเพื่อให้เป็นไปตาม คําจํากัดความความยุติธรรมอย่างน้อย 1 ข้อ ตัวอย่างข้อจํากัดของความเป็นธรรม ได้แก่- หลังการประมวลผล เอาต์พุตของโมเดล
- การเปลี่ยนแปลงฟังก์ชันการสูญเสียเพื่อเพิ่มค่าปรับจากการละเมิดเมตริกความเป็นธรรม
- เพิ่มข้อจํากัดทางคณิตศาสตร์ลงในโจทย์การเพิ่มประสิทธิภาพโดยตรง
เมตริกความเป็นธรรม
คําจํากัดความทางคณิตศาสตร์ว่าด้วย "ความเป็นธรรม" ที่สามารถวัดได้ เมตริกด้านความเป็นธรรมที่ใช้บ่อยบางส่วนได้แก่
เมตริกความยุติธรรมหลายรายการไม่เกี่ยวข้องกัน ดูความไม่เข้ากันของเมตริกความเป็นธรรม
G
การระบุแหล่งที่มาของกลุ่ม
แล้วสมมติว่าจริงๆ แล้วสําหรับแต่ละคน ในกลุ่มก็เหมือนกัน ผลของอคติที่มีต่อการระบุแหล่งที่มาอาจสูงขึ้นได้หากใช้การสุ่มตัวอย่างแบบตามสะดวกในการรวบรวมข้อมูล ในตัวอย่างที่ไม่ได้เป็นตัวแทน อาจมีการระบุแหล่งที่มา ที่ไม่ได้สะท้อนถึงความเป็นจริง
โปรดดูการให้น้ําหนักพิเศษกับกลุ่มเดียวกันและอคติในกลุ่ม
I
อคติทางอ้อม
การเชื่อมโยงหรือสมมติฐานโดยอัตโนมัติตามโมเดลทางความคิดและความทรงจําของบุคคล อคติโดยนัยมีผลกระทบดังต่อไปนี้
- วิธีการรวบรวมและแยกประเภทข้อมูล
- วิธีการออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง
ตัวอย่างเช่น เมื่อสร้างตัวแยกประเภทเพื่อระบุรูปภาพงานแต่งงาน วิศวกรอาจใช้ชุดเดรสสีขาวในรูปภาพเป็นจุดสนใจ อย่างไรก็ตาม ชุดเดรสสีขาวเป็นประเพณีของบางยุคสมัย และบางวัฒนธรรมเท่านั้น
โปรดดูการให้น้ําหนักพิเศษในการยืนยัน
ความไม่เข้ากันของเมตริกความเป็นธรรม
ความคิดที่ว่าความยุติธรรมบางอย่างเข้ากันไม่ได้และตอบสนองพร้อมกันไม่ได้ ผลที่ได้คือไม่มีเมตริกสากลเดียวสําหรับการวัดค่าความเป็นธรรมที่นําไปใช้กับปัญหา ML ทั้งหมดได้
ถึงแม้นี่อาจจะเป็นการสนับสนุน แต่เมตริกความยุติธรรมนั้นไม่ต่างกัน แต่เป็นการชี้ขาดว่าจะต้องมีการกําหนดประเด็นความเป็นธรรมตามบริบทสําหรับปัญหา ML ดังกล่าว โดยมีเป้าหมายในการป้องกันอันตรายที่เกี่ยวข้องกับ Use Case เฉพาะ
ดู "เกี่ยวกับความเป็นไปของความเป็นธรรม" สําหรับรายละเอียดเพิ่มเติมเกี่ยวกับหัวข้อนี้
ความเป็นธรรมของบุคคลธรรมดา
เมตริกความเป็นธรรมที่ตรวจสอบว่าบุคคลที่คล้ายคลึงกันได้รับการจัดประเภทในลักษณะเดียวกันหรือไม่ ตัวอย่างเช่น Brobdingnagian Academy อาจต้องการให้เป็นไปตาม ความเป็นธรรมของแต่ละคนโดยดูแลให้นักเรียน 2 คนที่มีคะแนนเท่ากันและคะแนนสอบมาตรฐานเท่าๆ กันมีโอกาสเข้าเรียนได้เท่ากัน
โปรดทราบว่าความยุติธรรมของแต่ละบุคคลขึ้นอยู่กับวิธีที่คุณกําหนดว่า "ความคล้ายคลึงกัน" (ในกรณีนี้คือคะแนนและคะแนนสอบ) คุณอาจเสี่ยงที่จะแนะนําปัญหาความเป็นธรรมใหม่หากเมตริกความคล้ายคลึงของคุณขาดข้อมูลที่สําคัญ (เช่น หลักสูตรความเข้มงวดของนักเรียน)
ดู "Fairness Through Awareness" เพื่อสนทนาเกี่ยวกับความเป็นธรรมโดยละเอียดเพิ่มเติม
อคติในกลุ่ม
การแสดงบางส่วนของกลุ่มหรือลักษณะของตนเอง หากผู้ทดสอบหรือผู้ประเมินประกอบไปด้วยเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิง อคติของกลุ่มอาจทําให้การทดสอบผลิตภัณฑ์หรือชุดข้อมูลไม่ถูกต้อง
การให้น้ําหนักพิเศษในกลุ่มคือ รูปแบบหนึ่งของการให้น้ําหนักที่มาของกลุ่ม โปรดดูการให้น้ําหนักพิเศษที่เหมือนกันสําหรับกลุ่มนอกกลุ่ม
N
การให้น้ําหนักพิเศษกับคําตอบ
โปรดดูการให้น้ําหนักการเลือก
O
ความเอนเอียงของกลุ่มภายนอก
แนวโน้มที่คุณจะเห็นสมาชิกนอกกลุ่มเหมือนกับสมาชิกกลุ่มมากกว่าเมื่อเทียบกับทัศนคติ ค่านิยม ลักษณะเฉพาะ และบุคลิกลักษณะอื่นๆ ในกลุ่มหมายถึงคนที่คุณโต้ตอบด้วยเป็นประจํา กลุ่มหมายถึงคนที่คุณไม่ได้โต้ตอบด้วยเป็นประจํา หากคุณสร้างชุดข้อมูลด้วยการขอให้ผู้คนระบุแอตทริบิวต์เกี่ยวกับกลุ่ม แอตทริบิวต์เหล่านั้นอาจมีความแตกต่างกันเพียงเล็กน้อยและเป็นแบบเหมารวมมากกว่าแอตทริบิวต์ที่ผู้เข้าร่วมแสดงเป็นคนในกลุ่ม
ตัวอย่างเช่น Lilliputians อาจอธิบายถึงบ้านของ Lilliputian คนอื่นๆ โดยมีรายละเอียดที่บ่งบอกถึงความแตกต่างเล็กๆ น้อยๆ ในสไตล์สถาปัตยกรรม หน้าต่าง ประตู และขนาด อย่างไรก็ตาม พวกลิลเลียนเตียนตัวเดิมอาจประกาศว่า เจ้า Robbdingnagians ตัวจริงอาศัยอยู่ในบ้านหลังเดียวกัน
การให้น้ําหนักพิเศษร่วมกันเป็นกลุ่มเป็นหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม
P
การให้น้ําหนักพิเศษกับการเข้าร่วม
คําพ้องของอคติที่ไม่ตอบกลับ โปรดดูการให้น้ําหนักการเลือก
หลังการประมวลผล
การปรับเอาต์พุตของโมเดลหลังจากที่เรียกใช้โมเดลแล้ว หลังการประมวลผลยังใช้เพื่อบังคับข้อจํากัดด้านความเป็นธรรมได้โดยไม่ต้องแก้ไขโมเดลเอง
เช่น นําขั้นตอนหลังการประมวลผลไปใช้กับตัวแยกประเภทไบนารีโดยการตั้งค่าเกณฑ์การจัดประเภทเพื่อให้ความเท่าเทียมของโอกาสได้รับการรักษาสําหรับบางแอตทริบิวต์ โดยตรวจสอบว่าอัตราผลบวกจริงเท่ากันสําหรับค่าทั้งหมดของแอตทริบิวต์นั้น
ความเท่าเทียมของการคาดการณ์
เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทที่ระบุมีอัตราการกําหนด เทียบเท่าสําหรับกลุ่มย่อยที่อยู่ระหว่างการพิจารณาหรือไม่
ตัวอย่างเช่น โมเดลที่คาดคะเนว่าระดับที่ยอมรับในมหาวิทยาลัยจะมีความเสมอภาคของความเสมอต้นเสมอปลายสําหรับสัญชาติ หากอัตราความแม่นยําเท่ากันสําหรับ Lilliputian และ Brobdingnagians
บางครั้งความคล้ายคลึงของการคาดการณ์เรียกอีกอย่างว่าความเท่าเทียมของอัตราการคาดการณ์
ดู "คําอธิบายเกี่ยวกับหลักความเป็นธรรม" (ส่วนที่ 3.2.1) สําหรับข้อมูลโดยละเอียดเพิ่มเติมเกี่ยวกับความคล้ายคลึงกันของการคาดการณ์
ความคล้ายคลึงของอัตราการคาดการณ์
อีกชื่อหนึ่งของความคล้ายคลึงกันของการคาดการณ์
การประมวลผลล่วงหน้า
การประมวลผลข้อมูลก่อนที่จะใช้เพื่อฝึกโมเดล การประมวลผลล่วงหน้านั้นง่ายพอๆ กับการนําคําออกจากคลังข้อมูลข้อความภาษาอังกฤษที่ไม่มีอยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจเป็นความซับซ้อนเหมือนการแสดงจุดข้อมูลในลักษณะที่กําจัดแอตทริบิวต์ที่สัมพันธ์กับแอตทริบิวต์ที่ละเอียดอ่อนให้ได้มากที่สุด การประมวลผลล่วงหน้าช่วยให้คุณปฏิบัติตามข้อจํากัดของความเป็นธรรมได้พร็อกซี (แอตทริบิวต์ที่ละเอียดอ่อน)
แอตทริบิวต์ที่ใช้เป็นแบบสแตนด์อโลนสําหรับแอตทริบิวต์ที่มีความละเอียดอ่อน เช่น รหัสไปรษณีย์อาจเป็นตัวระบุรายได้ เชื้อชาติ หรือชาติพันธุ์ขวา
การรายงานการให้น้ําหนัก
ข้อเท็จจริงที่ว่าความถี่ที่ผู้คนเขียนเกี่ยวกับการกระทํา สิ่งที่มาหรือทรัพย์สินไม่ได้สะท้อนถึงความถี่ในชีวิตจริง หรือระดับพร็อพเพอร์ตี้เป็นลักษณะของบุคคลหนึ่งๆ การให้น้ําหนักการรายงานอาจมีผลต่อองค์ประกอบ ข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้
ตัวอย่างเช่น ในหนังสือ คําว่า หัวเราะ แพร่หลายกว่าการหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่ของการหัวเราะ และการหายใจจากคลังข้อมูลหนังสืออาจชี้ว่า การหัวเราะมักเกิดขึ้นจากการหายใจ
S
การให้น้ําหนักตัวอย่าง
โปรดดูการให้น้ําหนักการเลือก
การให้น้ําหนักการเลือก
ข้อผิดพลาดในการสรุปที่ได้จากข้อมูลตัวอย่างเนื่องจากกระบวนการคัดเลือกที่ก่อให้เกิดความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตได้ในข้อมูลกับที่สังเกตไม่ได้ อคติการคัดเลือกรูปแบบต่อไปนี้มีอยู่:
- การให้น้ําหนักตัวอย่าง: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับกลุ่มประชากรที่โมเดลแมชชีนเลิร์นนิงกําลังคาดการณ์
- การให้น้ําหนักตัวอย่าง: ระบบจะไม่เก็บรวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
- อคติที่ไม่ตอบกลับ (หรือที่เรียกว่าการให้น้ําหนักการมีส่วนร่วม): ผู้ใช้จากบางกลุ่มเลือกไม่ใช้แบบสํารวจในอัตราที่แตกต่างจากผู้ใช้จากกลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าคุณสร้างโมเดลแมชชีนเลิร์นนิง ที่คาดคะเนความเพลิดเพลินของภาพยนตร์ ในการรวบรวมข้อมูลการฝึก ให้ส่งแบบสํารวจให้กับทุกคนที่แถวหน้าของโรงภาพยนตร์ซึ่งแสดงภาพยนตร์ อาจดูเหมือนเป็นวิธีการที่เหมาะสมในการรวบรวมชุดข้อมูล แต่การรวบรวมข้อมูลรูปแบบนี้อาจเริ่มใช้อคติการเลือกในรูปแบบต่อไปนี้
- อคติโดยการสุ่มตัวอย่าง: การสุ่มตัวอย่างจากกลุ่มประชากรที่เลือกที่จะดูหนัง การคาดคะเนของนายแบบ/นายแบบอาจไม่สื่อถึงผู้คนที่ยังไม่ได้แสดงความสนใจในระดับนั้นในภาพยนตร์เสมอไป
- การให้น้ําหนักตัวอย่าง: แทนที่จะใช้การสุ่มตัวอย่างจากประชากรเป้าหมาย (ผู้ใช้ทั้งหมดในภาพยนตร์) คุณจะต้องสุ่มตัวอย่างเฉพาะคนที่อยู่แถวหน้าเท่านั้น อาจเป็นไปได้ว่าผู้คนที่อยู่ในแถวหน้าสนใจภาพยนตร์มากกว่าแถวอื่นๆ
- การมีอคติที่ไม่ได้ตอบกลับ: โดยทั่วไป ผู้ที่มีความคิดเห็นที่ชัดเจนมักตอบสนองต่อแบบสํารวจที่ไม่บังคับบ่อยกว่าผู้ที่แสดงความคิดเห็นเพียงเล็กน้อย เนื่องจากการสํารวจภาพยนตร์เป็นแบบไม่บังคับ คําตอบจึงมีแนวโน้มที่จะทําให้เกิดการกระจายแบบโมดัลมากกว่าการกระจายแบบปกติ (รูประฆัง)
แอตทริบิวต์ที่ละเอียดอ่อน
แอตทริบิวต์มนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษด้วยเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนตัวU
ไม่ทราบ (สําหรับแอตทริบิวต์ที่ละเอียดอ่อน)
สถานการณ์ที่แอตทริบิวต์ที่ละเอียดอ่อนมีอยู่ แต่ไม่รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่มีความละเอียดอ่อนมักจะสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูลของบุคคลหนึ่ง โมเดลที่ผ่านการฝึกโดยไม่รู้ตัวเกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนอาจยังคงมีผลกระทบที่แตกต่างกันเกี่ยวกับแอตทริบิวต์ดังกล่าว หรือละเมิดข้อจํากัดด้านความเป็นธรรมอื่นๆ