หน้านี้มีคําในอภิธานศัพท์ตามหลักความเป็นธรรม สําหรับอภิธานศัพท์ทั้งหมด คลิกที่นี่
A
แอตทริบิวต์
คําพ้องความหมายสําหรับ feature
ในความเป็นธรรมของแมชชีนเลิร์นนิง แอตทริบิวต์มักหมายถึงลักษณะเฉพาะที่เกี่ยวข้องกับบุคคล
การให้น้ําหนักแบบอัตโนมัติ
เมื่อผู้ใช้ที่มีอํานาจตัดสินใจของมนุษย์ชอบคําแนะนําของระบบการตัดสินใจอัตโนมัติมากกว่าข้อมูลที่ไม่มีการทํางานอัตโนมัติ แม้ว่าระบบการตัดสินใจอัตโนมัติจะทําผิดพลาดก็ตาม
ข
อคติ (จริยธรรม/ความเป็นธรรม)
1. การตีกรอบ อคติ หรือความชอบ บางอย่าง บุคคล หรือกลุ่มบุคคล การให้น้ําหนักเหล่านี้อาจส่งผลกระทบต่อการรวบรวมและตีความข้อมูล การออกแบบระบบ และวิธีที่ผู้ใช้โต้ตอบกับระบบ รูปแบบการให้น้ําหนักพิเศษประเภทนี้รวมถึง:
- การให้น้ําหนักพิเศษอัตโนมัติ
- การให้น้ําหนักพิเศษในการยืนยัน
- การให้น้ําหนักพิเศษของผู้ทดสอบ
- การให้น้ําหนักการระบุแหล่งที่มาของกลุ่ม
- การให้น้ําหนักพิเศษโดยนัย
- การให้น้ําหนักพิเศษในกลุ่ม
- อคติต่อกลุ่มนอกกลุ่ม
2. ข้อผิดพลาดที่เป็นระบบที่เกิดจากการสุ่มตัวอย่างหรือกระบวนการรายงาน รูปแบบการให้น้ําหนักพิเศษประเภทนี้รวมถึง:
- การครอบคลุมของการครอบคลุม
- การให้น้ําหนักพิเศษกับการตอบกลับ
- การให้น้ําหนักการเข้าร่วม
- การให้น้ําหนักพิเศษในการรายงาน
- การสุ่มตัวอย่างการให้น้ําหนักพิเศษ
- การให้น้ําหนักการเลือก
อย่าสับสนกับการให้น้ําหนักพิเศษในโมเดลแมชชีนเลิร์นนิงหรืออคติการคาดการณ์
ค
การให้น้ําหนักพิเศษในการยืนยัน
แนวโน้มการค้นหา ตีความ ทําความชื่นชอบ และเรียกคืนข้อมูลในลักษณะที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ก่อนแล้ว นักพัฒนาแอปแมชชีนเลิร์นนิงอาจเก็บรวบรวมหรือติดป้ายกํากับข้อมูลโดยไม่เจตนาในลักษณะที่สร้างผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่ของตน การให้น้ําหนักพิเศษการยืนยันเป็นรูปแบบหนึ่งของอคติโดยปริยาย
การให้น้ําหนักพิเศษของผู้ทดสอบคือรูปแบบการให้น้ําหนักพิเศษการยืนยันซึ่งผู้ทดสอบจะฝึกโมเดลต่อไปจนกว่าสมมติฐานที่มีอยู่จะได้รับการยืนยัน
ความยุติธรรมที่เป็นกลาง
เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทสร้างผลลัพธ์ที่เหมือนกันสําหรับตัวบุคคลตัวใดตัวหนึ่งที่เหมือนกับบุคคลที่ 1 หรือไม่ ยกเว้นส่วนที่เป็นไปตามแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินตัวแยกประเภทสําหรับความยุติธรรมแบบต่อต้านข้อเท็จจริงเป็นวิธีหนึ่งในการแสดงแหล่งที่มาที่เป็นไปได้ของการให้น้ําหนักพิเศษในรูปแบบหนึ่งดู"When Worlds Collide: การผสานรวมสมมติฐานที่แตกต่างกันเกี่ยวกับความยุติธรรมและความยุติธรรมเพื่อหารือรายละเอียดเกี่ยวกับความเป็นธรรม
อคติที่ครอบคลุม
D
ความเท่าเทียมกันของข้อมูลประชากร
เมตริกความเป็นธรรมที่น่าพอใจหากผลการจัดประเภทของโมเดลไม่ได้ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนที่ระบุ
เช่น หากทั้ง Lilliputians และ Brobdingnagians เคยสมัคร Glubbdubdrib University ก็จะได้ความเท่าเทียมด้านข้อมูลประชากรหากเปอร์เซ็นต์ของ Lilliputian ที่ได้รับการยอมรับเท่ากับเปอร์เซ็นต์ของ Brobdingnagians ที่ยอมรับ ไม่ว่ากลุ่มหนึ่งจะมีคุณสมบัติสูงกว่าอีกกลุ่มหรือไม่
ตรงกันข้ามกับโอกาสที่เทียบเท่าและความเท่าเทียมกันของโอกาส ซึ่งช่วยให้การแยกประเภทเป็นผลลัพธ์รวมโดยอิงตามแอตทริบิวต์ที่มีความละเอียดอ่อนได้ แต่ไม่อนุญาตให้แยกประเภทผลการค้นหาสําหรับป้ายกํากับที่ระบุว่ามาจากการสังเกตการณ์โดยตรงบางรายการตามแอตทริบิวต์ที่มีความละเอียดอ่อน ดู"การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น
ดูหมิ่นความแตกต่าง
การตัดสินใจเกี่ยวกับผู้คนที่ส่งผลต่อกลุ่มย่อย ของประชากรต่างๆ อย่างไม่เป็นสัดส่วน ซึ่งโดยปกติจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจด้วยอัลกอริทึมก่อให้เกิดอันตรายหรือเป็นประโยชน์ต่อกลุ่มย่อยบางกลุ่มมากกว่ากลุ่มอื่น
ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่กําหนดสิทธิ์ในการกู้ยืมสําหรับบ้านจําลองของ Lilliputian มีโอกาสจัดประเภทเป็น "ไม่มีสิทธิ์" มากกว่าหากที่อยู่ทางไปรษณีย์ของผู้เผยแพร่โฆษณามีรหัสไปรษณีย์ที่เฉพาะเจาะจง หาก Bigllendian Lilliputian น่าจะส่งไปรษณีย์โดยใช้รหัสไปรษณีย์นี้มากกว่า Little-Endian Lilliputians อัลกอริทึมอาจมีผลลัพธ์แตกต่างกัน
ตรงกันข้ามกับการดูแลที่แตกต่างกันโดยสิ้นเชิง ซึ่งมุ่งเน้นไปที่ความไม่สอดคล้องที่เมื่อลักษณะเฉพาะของกลุ่มย่อยเป็นอินพุตที่ชัดเจนสําหรับกระบวนการตัดสินใจแบบอัลกอริทึม
การดูแลที่แตกต่างกัน
ปัจจัยที่เกี่ยวข้อง' แอตทริบิวต์ที่ละเอียดอ่อน ในกระบวนการตัดสินใจโดยใช้อัลกอริทึมเพื่อให้กลุ่มย่อยของผู้คนแต่ละคนได้รับการปฏิบัติแตกต่างกันไป
เช่น พิจารณาอัลกอริทึมที่ตัดสินการมีสิทธิ์ของ Lilliputians สําหรับสินเชื่อบ้านจําลองตามข้อมูลที่ให้ไว้ในใบสมัครสินเชื่อ หากอัลกอริทึมใช้แอฟฟิลิเอตของ Lilitian เป็น Big-Endian หรือ Little-Endian เป็นอินพุต ระบบจะออกคําสั่งที่แตกต่างกันอย่างสิ้นเชิงตามมิติข้อมูลนั้น
ตรงกันข้ามกับผลกระทบที่แตกต่างกัน ซึ่งมุ่งเน้นไปที่ความแตกต่างในผลกระทบทางสังคมต่อการตัดสินใจด้วยอัลกอริทึมที่มีต่อกลุ่มย่อย โดยไม่คํานึงว่ากลุ่มย่อยเหล่านั้นเป็นโมเดลอินพุต
จ.
ความเท่าเทียมของโอกาส
เมตริกความเป็นธรรมที่ตรวจสอบว่าในป้ายกํากับ (ซึ่งให้ข้อได้เปรียบหรือเป็นประโยชน์ต่อบุคคลหนึ่งๆ) หรือไม่ และแอตทริบิวต์ที่กําหนดไว้ ตัวแยกประเภทจะคาดการณ์ป้ายกํากับดังกล่าวได้ดีพอๆ กับค่าทั้งหมดของแอตทริบิวต์นั้น กล่าวอีกนัยหนึ่งคือ ความเท่าเทียมของโอกาสจะวัดว่าผู้ที่ควรมองเห็นโอกาสนั้นมีโอกาสทําอย่างเท่าเทียมกันหรือไม่ โดยไม่คํานึงถึงการเป็นสมาชิกกลุ่มตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้งโครงการ Lilliputian และ Brobdingnagians เพื่อเข้าร่วมโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมศึกษาของ Lilliputian มอบหลักสูตรชั้นเรียนคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนมากเข้าเรียนหลักสูตรมหาวิทยาลัย โรงเรียนมัธยมต้นของ Brobdingnagians ไม่มีชั้นเรียนคณิตศาสตร์เลย ด้วยเหตุนี้ นักเรียนจํานวนน้อยจึงมีคุณสมบัติเข้าเกณฑ์ ความเท่าเทียมกันของโอกาสเป็นที่น่าพอใจสําหรับป้ายกํากับ ""adaccept" ที่เกี่ยวข้องกับสัญชาติ (Lilliputian หรือ Brobdingnagian) ที่ต้องการ หากนักเรียนที่มีคุณสมบัติเหมาะสมมีแนวโน้มสูงที่จะได้รับการยอมรับ โดยไม่คํานึงว่านักเรียนหรือ Libliputian หรือเป็น Brobdingnagian หรือไม่
ตัวอย่างเช่น สมมติว่ามี Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วมมหาวิทยาลัย Glubbdubdrib และตัดสินใจรับนักศึกษาได้ดังนี้
ตารางที่ 1 ผู้สมัครของ Lilliputian (90% คือผู้มีคุณสมบัติ)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับแล้ว | 45 | 3 |
ถูกปฏิเสธ | 45 | 7 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติที่เข้าเกณฑ์ที่ยอมรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านเกณฑ์ปฏิเสธ: 7/10 = 70% เปอร์เซ็นต์รวมของนักเรียนลิลิเตีย (45+3)/100 = 48% |
ตารางที่ 2 ผู้สมัคร Brobdingnagian (10% คือผู้มีคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับแล้ว | 5 | 9 |
ถูกปฏิเสธ | 5 | 81 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติที่เข้าเกณฑ์ที่ยอมรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 81/90 = 90% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่ยอมรับ: (5+9)/100 = 14% |
ตัวอย่างที่ยกมาข้างต้นแสดงให้เห็นถึงโอกาสที่จะเท่าเทียมกับการยอมรับนักเรียน/นักศึกษาที่มีคุณสมบัติเหมาะสม เพราะทั้ง Lilliputian และ Libdingnagians ที่ผ่านเกณฑ์ทั้ง 20 คนจะมีโอกาสได้รับการยอมรับ 50%
ดู"ความเท่าเทียมของโอกาสในการเรียนรู้ภายใต้การควบคุมดูแล"สําหรับการสนทนาโดยละเอียดเกี่ยวกับความเท่าเทียมของโอกาส และดู"การโจมตีการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น เพื่อสร้างภาพที่ชัดเจนและข้อดีข้อเสียของการเพิ่มประสิทธิภาพ
เลขคี่ที่เท่ากัน
เมตริกความเป็นธรรมที่ตรวจสอบว่าตัวแยกประเภทหนึ่งๆ คาดการณ์ป้ายกํากับดังกล่าวได้ดีเท่าๆ กันสําหรับค่าทั้งหมดของแอตทริบิวต์นั้นๆ หรือไม่ตัวอย่างเช่น สมมติว่ามหาวิทยาลัย Glubbdubdrib ยอมรับทั้ง Lilliputian และ Brobdingnagians เพื่อเข้าร่วมโปรแกรมคณิตศาสตร์ที่เข้มงวด Lilliputians', โรงเรียนมัธยม มีหลักสูตรชั้นเรียนคณิตศาสตร์ที่มีประสิทธิภาพ และนักเรียนส่วนมากมีคุณสมบัติสําหรับหลักสูตรมหาวิทยาลัย โรงเรียนนายหน้าบํานาญ' ชั้นมัธยมปลายไม่ต้องเรียนคณิตศาสตร์ ผลที่ได้คือนักเรียนที่มีคุณสมบัติไม่มากนัก กรณีที่คู่ความของผู้สมัครไม่เท่ากันไม่ว่าผู้สมัครจะเป็น Lilliputian หรือ Brobdingnagian ก็จะได้รับวุฒิการศึกษาเท่าๆ กัน และหากผู้สมัครไม่เข้าเกณฑ์ ผู้สมัครก็มีแนวโน้มที่จะถูกปฏิเสธเช่นกัน
สมมติว่า Lilliputian 100 คนและ Brobdingnagians 100 คนสมัครเข้าร่วม Glubbdubdrib มหาวิทยาลัย และผลการตัดสินสิทธิ์เข้าชมมีดังนี้
ตารางที่ 3 ผู้สมัครของ Lilliputian (90% คือผู้มีคุณสมบัติ)
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับแล้ว | 45 | 2 |
ถูกปฏิเสธ | 45 | 8 |
รวม | 90 | 10 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติที่เข้าเกณฑ์ที่ยอมรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านเกณฑ์ปฏิเสธ: 8/10 = 80% เปอร์เซ็นต์รวมของนักเรียนที่ Lilliputian ยอมรับ: (45+2)/100 = 47% |
ตารางที่ 4 ผู้สมัคร Brobdingnagian (10% คือผู้มีคุณสมบัติ):
เข้าเกณฑ์ | คุณสมบัติไม่ครบ | |
---|---|---|
ยอมรับแล้ว | 5 | 18 |
ถูกปฏิเสธ | 5 | 72 |
รวม | 10 | 90 |
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติที่เข้าเกณฑ์ที่ยอมรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่ผ่านการรับรองถูกปฏิเสธ: 72/90 = 80% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่ยอมรับ: (5+18)/100 = 23% |
มีโอกาสที่พอสมควรเพราะนักเรียน Lilliputian และ Brobdingnagian ที่เข้าเกณฑ์จะมีโอกาสได้รับการยอมรับ 50% และ Lilliputian ที่ไม่ผ่านเกณฑ์และ Brobdingnagian มีโอกาสถูกปฏิเสธ 80%
ความน่าจะเป็นที่เท่าเทียมจะมีการกําหนดอย่างเป็นทางการใน "ความเท่าเทียมของ โอกาสในการเรียนรู้ภายใต้การควบคุมดูแล" ดังนี้ "ตัวคาดการณ์ Ŷ saisfies เลขคี่ที่เสมอต้นเสมอปลายตามแอตทริบิวต์ A ที่ได้รับการปกป้อง และผลลัพธ์ Y หาก Ŷ และ A เป็นอิสระต่อกันโดยมีเงื่อนไขบน Y."
การให้น้ําหนักพิเศษกับการทดลอง
โปรดดูหัวข้ออคติการยืนยัน
ศ
ข้อจํากัดด้านความเป็นธรรม
การใช้ข้อจํากัดกับอัลกอริทึมเพื่อให้เป็นไปตามคําจํากัดความของความยุติธรรมอย่างน้อย 1 ข้อ ตัวอย่างข้อจํากัดของความเป็นธรรมมีดังนี้- หลังการประมวลผลเอาต์พุตของโมเดล
- การเปลี่ยนแปลงฟังก์ชันการสูญเสียเพื่อให้ได้รับบทลงโทษสําหรับการละเมิดเมตริกความยุติธรรม
- เพิ่มข้อจํากัดทางคณิตศาสตร์โดยตรงลงในโจทย์การเพิ่มประสิทธิภาพ
เมตริกความเป็นธรรม
คําจํากัดความทางคณิตศาสตร์ของ "ความเป็นธรรม" ที่สามารถวัดได้ เมตริกความเป็นธรรมที่ใช้กันโดยทั่วไปมีดังนี้
- ความน่าจะเป็นที่เท่ากัน
- ความเท่าเทียมกันของการคาดการณ์
- หลักธรรมที่เป็นธรรม
- ความเท่าเทียมกันของข้อมูลประชากร
เมตริกความยุติธรรมหลายรายการมีความแตกต่างร่วมกัน โปรดดูความไม่เข้ากันของเมตริกความเป็นธรรม
G
การให้น้ําหนักการระบุแหล่งที่มากลุ่ม
สันนิษฐานว่าสิ่งที่เกิดขึ้นจริงสําหรับแต่ละบุคคลก็เป็นจริงด้วยเช่นกัน ทุกคนในกลุ่มนั้น ผลของการให้น้ําหนักการระบุแหล่งที่มาของกลุ่มจะชัดเจนขึ้น หากมีการใช้การสุ่มตัวอย่างแบบตามสะดวก สําหรับการรวบรวมข้อมูล ในตัวอย่างที่ไม่ได้เป็นตัวแทน การระบุแหล่งที่มาอาจ ไม่สะท้อนถึงความเป็นจริง
นอกจากนี้ โปรดดูการให้น้ําหนักพิเศษในกลุ่มเดียวกัน และการให้น้ําหนักพิเศษในกลุ่ม
I
การให้น้ําหนักพิเศษโดยนัย
ทําการเชื่อมโยงหรือสมมติฐานโดยอัตโนมัติตามโมเดลทางความคิดและความคิดของบุคคลหนึ่งๆ การให้น้ําหนักพิเศษอาจส่งผลกระทบดังต่อไปนี้
- วิธีรวบรวมและจัดประเภทข้อมูล
- วิธีการออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง
เช่น เมื่อสร้างตัวแยกประเภทเพื่อระบุรูปงานแต่งงาน วิศวกรสามารถใช้ชุดเดรสสีขาวในรูปภาพเป็นลักษณะเด่น อย่างไรก็ตาม ชุดเดรสสีขาวนั้นเป็นงานประเพณีเฉพาะในบางยุคสมัยและในวัฒนธรรมบางอย่างเท่านั้น
และดูอคติการยืนยัน
ความไม่เข้ากันของเมตริกความเป็นธรรม
ความคิดที่ว่าธรรมที่เป็นธรรมบางอย่างนั้นเข้ากันไม่ได้ และต้องมีความพึงพอใจไปพร้อมๆ กันไม่ได้ ด้วยเหตุนี้ จึงไม่มีเมตริกแบบเป็นสากลเพียงรายการเดียวในการวัดค่าความเป็นธรรมที่นําไปใช้กับปัญหา ML ทั้งหมดได้
ถึงแม้การดําเนินการนี้อาจดูขัดกับเมตริกความยุติธรรม แต่นั่นก็ไม่ได้หมายความว่าการดําเนินการอย่างเป็นธรรมจะไม่ก่อให้เกิดผลใดๆ แต่ชี้ให้เห็นว่าความยุติธรรมจะต้องได้รับการกําหนดตามบริบทของปัญหา ML ที่ระบุ แต่มีเป้าหมายเพื่อป้องกันอันตรายต่อกรณีการใช้งานที่เฉพาะเจาะจง
ดู"เกี่ยวกับ (ความเป็นไป)ของความเป็นธรรม"สําหรับรายละเอียดเพิ่มเติมเกี่ยวกับหัวข้อนี้
ความเป็นธรรมส่วนบุคคล
เมตริกความเป็นธรรมที่ตรวจสอบว่าบุคคลที่คล้ายกันได้รับการจัดประเภทคล้ายกันหรือไม่ เช่น Brobdingnagian Academy อาจต้องการรับรองด้านความเป็นธรรมของตนเองโดยตรวจสอบว่านักเรียน 2 คนที่มีคะแนนเท่ากันและคะแนนสอบตามเกณฑ์มาตรฐานจะมีแนวโน้มเท่ากันสําหรับการได้รับใบสมัคร
โปรดทราบว่าความยุติธรรมของแต่ละบุคคลจะอาศัยวิธีที่คุณกําหนด "ความคล้ายคลึงกัน"(ในกรณีนี้คือคะแนนและคะแนนสอบ) และคุณมีความเสี่ยงที่จะใช้ปัญหาความยุติธรรมใหม่หากเมตริกความคล้ายคลึงของคุณพลาดข้อมูลสําคัญ (เช่น ความเข้มงวดของหลักสูตรของนักเรียน)
ดู"Fairness Through การรับรู้&การเสนอราคา]สําหรับรายละเอียดเกี่ยวกับความเป็นธรรมของแต่ละบุคคล
การให้น้ําหนักพิเศษในกลุ่ม
แสดงบางส่วนของกลุ่มหรือลักษณะของตัวเอง หากผู้ทดสอบหรือผู้ประเมินประกอบด้วยนักพัฒนาซอฟต์แวร์แมชชีนเลิร์นนิง เพื่อน ครอบครัว หรือเพื่อนร่วมงาน การให้น้ําหนักพิเศษในกลุ่มอาจทําให้การทดสอบผลิตภัณฑ์หรือชุดข้อมูลไม่ถูกต้อง
การให้น้ําหนักพิเศษคือรูปแบบหนึ่งของการให้น้ําหนักการระบุแหล่งที่มาของกลุ่ม และดูการให้น้ําหนักพิเศษในกลุ่มเดียวกัน
ไม่ใช่
การให้น้ําหนักคําตอบ
O
อคติต่อกลุ่มนอกกลุ่ม
แนวโน้มที่จะเห็นสมาชิกภายนอกกลุ่มคล้ายกับสมาชิกในกลุ่มเมื่อเปรียบเทียบทัศนคติ ค่า บุคลิกลักษณะ และลักษณะอื่นๆ ในกลุ่มหมายถึงคนที่คุณโต้ตอบด้วยเป็นประจํา นอกกลุ่มหมายถึงคนที่คุณไม่ได้โต้ตอบด้วยเป็นประจํา หากคุณสร้างชุดข้อมูลด้วยการขอให้ผู้คนระบุแอตทริบิวต์เกี่ยวกับกลุ่มออก แอตทริบิวต์ที่ได้นั้นต่างกันเพียงเล็กน้อยและเหนียวแน่นกว่าแอตทริบิวต์ที่ผู้เข้าร่วมแสดงสําหรับสมาชิกในกลุ่ม
ยกตัวอย่างเช่น Lilliputian อาจหมายถึงบ้านของ Lilliputian คนอื่นๆ ที่ให้รายละเอียดที่ดี โดยเน้นความแตกต่างทางสไตล์ หน้าต่าง ประตู และขนาดต่างๆ ทางสถาปัตยกรรม แต่ Liliiputian คนเดียวกันอาจประกาศไปว่า Brobdingnagians ทุกคนอาศัยอยู่ในบ้านหลังเดียวกัน
การให้น้ําหนักพิเศษให้กลุ่มเดียวกันคืออคติการระบุแหล่งที่มาของกลุ่ม
นอกจากนี้ โปรดดูการให้น้ําหนักพิเศษในกลุ่ม
P
การให้น้ําหนักการเข้าร่วม
คําพ้องความหมายสําหรับอคติที่ไม่ตอบกลับ ดูการให้น้ําหนักการเลือก
หลังการประมวลผล
การปรับเอาต์พุตของโมเดลหลังจากที่เรียกใช้โมเดลแล้ว หลังการประมวลผล คุณจะบังคับใช้ข้อจํากัดด้านความเป็นธรรมได้โดยไม่ต้องแก้ไขโมเดลด้วยตัวเอง
เช่น อาจใช้การประมวลผลหลังการประมวลผลกับตัวแยกประเภทไบนารีโดยการตั้งค่าเกณฑ์การแยกประเภทเพื่อให้ความเท่าเทียมของโอกาสได้รับการรักษาสําหรับบางแอตทริบิวต์ โดยตรวจสอบว่า อัตราผลบวกจริง มีค่าเท่ากันทั้งหมดสําหรับแอตทริบิวต์นั้น
ความเท่าเทียมกันของการคาดการณ์
เมตริกความเป็นธรรมที่ตรวจสอบว่าในตัวแยกประเภท ตัวแยกประเภทที่ระบุมีค่าเทียบเท่าในกลุ่มย่อยภายใต้การพิจารณาหรือไม่
เช่น โมเดลที่คาดการณ์การยอมรับในมหาวิทยาลัยจะตอบสนองความเท่าเทียมของสัญชาติสําหรับสัญชาติ หากอัตราความแม่นยําเท่ากันสําหรับ Lilliputian และ Brobdingnagians
บางครั้งความเท่าเทียมกันของการคาดการณ์เรียกอีกอย่างว่าความเท่าเทียมกันของอัตราการคาดการณ์
ดู"คําจํากัดความที่เป็นธรรม อธิบายแล้ว" (ส่วนที่ 3.2.1) สําหรับรายละเอียดเพิ่มเติมเกี่ยวกับการคาดการณ์ความเท่าเทียมกัน
ความเท่าเทียมของอัตราการคาดการณ์
อีกชื่อหนึ่งของความเท่าเทียมกันของการคาดการณ์
การประมวลผลล่วงหน้า
การประมวลผลข้อมูลก่อนที่จะฝึกโมเดล การประมวลผลล่วงหน้าอาจง่ายพอๆ กับการนําคําออกจากคลังข้อมูลภาษาอังกฤษซึ่งไม่ได้ระบุไว้ในพจนานุกรมภาษาอังกฤษ หรืออาจมีความซับซ้อนพอๆ กับการแสดงจุดข้อมูลในลักษณะที่กําจัดแอตทริบิวต์หลายรายการซึ่งสัมพันธ์กับแอตทริบิวต์ที่ละเอียดอ่อนให้ได้มากที่สุด การประมวลผลล่วงหน้าจะช่วยตอบโจทย์ข้อจํากัดด้านความเป็นธรรมได้พร็อกซี (แอตทริบิวต์ที่ละเอียดอ่อน)
แอตทริบิวต์ที่ใช้เป็นขาตั้งในแอตทริบิวต์ที่มีความละเอียดอ่อน เช่น รหัสไปรษณีย์ของบุคคลธรรมดาสามารถใช้เป็นตัวแทนรายได้ เชื้อชาติ หรือชาติพันธุ์R
การให้น้ําหนักการรายงาน
ข้อเท็จจริงที่ว่าความถี่ที่ผู้คนเขียนเกี่ยวกับการกระทํา รายได้ หรือทรัพย์สินไม่ได้สะท้อนถึงความถี่ในชีวิตจริง หรือระดับที่พร็อพเพอร์ตี้เป็นลักษณะนิสัยของบุคคล อคติในการรายงานอาจส่งผลต่อ องค์ประกอบของข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้
เช่น ในหนังสือ คําว่าหัวเราะจะแพร่หลายกว่าการหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่ของการหัวเราะ และการหายใจจากคลังข้อมูลหนังสืออาจชี้ว่า การหัวเราะมักเกิดขึ้นมากกว่าการหายใจ
ส
การให้น้ําหนักพิเศษ
การให้น้ําหนักการเลือก
ข้อผิดพลาดในข้อสรุปที่ได้จากข้อมูลตัวอย่างเนื่องจากกระบวนการเลือกที่ทําให้เกิดความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตได้ในข้อมูลกับข้อมูลที่สังเกตไม่ได้ รูปแบบการให้น้ําหนักพิเศษที่เลือกมีดังต่อไปนี้
- การให้น้ําหนักกับการครอบคลุม: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับประชากรที่โมเดลแมชชีนเลิร์นนิงกําลังทําการคาดการณ์
- การให้น้ําหนักการสุ่มตัวอย่าง: จะไม่มีการรวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
- การให้น้ําหนักพิเศษที่ไม่ตอบกลับ (เรียกอีกอย่างว่าการให้น้ําหนักการเข้าร่วม): ผู้ใช้จากบางกลุ่มเลือกไม่ใช้แบบสํารวจในอัตราที่แตกต่างจากผู้ใช้จากกลุ่มอื่นๆ
ตัวอย่างเช่น สมมติว่าคุณกําลังสร้างโมเดลแมชชีนเลิร์นนิงที่คาดการณ์ความเพลิดเพลินของภาพยนตร์ ในการรวบรวมข้อมูลการฝึกอบรม ให้ส่งแบบสํารวจให้กับทุกคนในแถวหน้าของโรงภาพยนตร์ฉายภาพยนตร์ ในทางตรงกันข้าม วิธีนี้อาจดูเหมือนเป็นวิธีรวบรวมชุดข้อมูลที่สมเหตุสมผล แต่การรวบรวมข้อมูลรูปแบบนี้อาจแนะนําการให้น้ําหนักพิเศษในรูปแบบต่อไปนี้
- อคติที่เกิดขึ้นในโลกนี้: การสุ่มตัวอย่างจากประชากรที่เลือกดูภาพยนตร์ การคาดการณ์ของโมเดลอาจไม่ได้จัดประเภทให้กว้างๆ กับผู้ที่ไม่ได้แสดงความสนใจในภาพยนตร์เรื่องนั้นมาก่อน
- การให้น้ําหนักตัวอย่าง: แทนที่จะใช้การสุ่มตัวอย่างจากประชากรที่ตั้งใจ (ทุกคนที่อยู่ในภาพยนตร์) คุณจะได้สุ่มตัวอย่างเฉพาะคนที่อยู่แถวหน้า ผู้คนที่นั่งแถวหน้าอาจสนใจเรื่องภาพยนตร์มากกว่าแถวอื่นๆ
- ความลําเอียงในการไม่ตอบ: โดยทั่วไป ผู้ที่มีความคิดเห็นดีมักจะตอบแบบสํารวจที่ไม่บังคับ (บ่อยกว่าคนที่เป็นความคิดเห็นน้อยๆ) เนื่องจากไม่บังคับสําหรับแบบสํารวจภาพยนตร์ คําตอบจึงมักมีแนวโน้มที่จะทําให้เกิดการกระจายแบบโมดัลมากกว่าการกระจายแบบปกติ (กระดิ่ง)
แอตทริบิวต์ที่มีความละเอียดอ่อน
แอตทริบิวต์ของมนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษเพื่อเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนตัวU
การรับรู้ (ไปยังแอตทริบิวต์ที่มีความละเอียดอ่อน)
สถานการณ์ที่แอตทริบิวต์ที่มีความละเอียดอ่อนมีแต่ไม่ได้รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่มีความละเอียดอ่อนมักสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูลของผู้ใช้ โมเดลที่ฝึกโดยไม่รู้ตัวเกี่ยวกับแอตทริบิวต์ที่มีความละเอียดอ่อนอาจยังมีผลลัพธ์ที่แตกต่างกันต่อแอตทริบิวต์นั้น หรือละเมิดข้อจํากัดด้านความเป็นธรรมอื่นๆ