หน้านี้ได้รับการแปลโดย Cloud Translation API

อภิธานศัพท์แมชชีนเลิร์นนิง: AI ที่มีความรับผิดชอบ

หน้านี้มีคำศัพท์ในพจนานุกรม AI ที่มีความรับผิดชอบ ดูคำศัพท์ทั้งหมดได้โดยคลิกที่นี่

A

แอตทริบิวต์

#responsible

คำพ้องความหมายของฟีเจอร์

ในความเท่าเทียมของแมชชีนเลิร์นนิง แอตทริบิวต์มักหมายถึง ลักษณะที่เกี่ยวข้องกับบุคคล

อคติในการทำงานอัตโนมัติ

#responsible

เมื่อผู้มีอำนาจตัดสินใจที่เป็นมนุษย์เลือกใช้คำแนะนำที่ระบบการตัดสินใจอัตโนมัติสร้างขึ้นมากกว่าข้อมูลที่สร้างขึ้นโดยไม่มีการทำงานอัตโนมัติ แม้ว่าระบบการตัดสินใจอัตโนมัติจะทำผิดพลาดก็ตาม

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของ อคติ ในหลักสูตรเร่งรัดแมชชีนเลิร์นนิง

B

อคติ (จริยธรรม/ความเป็นธรรม)

#responsible

#fundamentals

1. การเหมารวม อคติ หรือการเข้าข้างสิ่งต่างๆ บุคคล หรือกลุ่มบางกลุ่มมากกว่ากลุ่มอื่นๆ อคติเหล่านี้อาจส่งผลต่อการเก็บรวบรวมและการตีความข้อมูล การออกแบบระบบ และวิธีที่ผู้ใช้โต้ตอบกับระบบ รูปแบบของอคติประเภทนี้ ได้แก่

อคติในการทำงานอัตโนมัติ
อคติยืนยันความคิดตัวเอง
อคติของผู้ทดลอง
อคติในการระบุแหล่งที่มาของกลุ่ม
อคติโดยไม่รู้ตัว
อคติในกลุ่ม
อคติเกี่ยวกับความเหมือนกันของกลุ่มนอก

2. ข้อผิดพลาดของระบบที่เกิดจากขั้นตอนการสุ่มตัวอย่างหรือการรายงาน รูปแบบของอคติประเภทนี้ ได้แก่

อคติในการครอบคลุม
ความลำเอียงเนื่องจากไม่ได้ตอบ
อคติในการเข้าร่วม
อคติในการรายงาน
อคติในการสุ่มตัวอย่าง
อคติในการเลือก

อย่าสับสนกับคำอคติในโมเดลแมชชีนเลิร์นนิง หรืออคติในการคาดการณ์

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติใน หลักสูตรเร่งรัดแมชชีนเลิร์นนิง

C

อคติยืนยันความคิดตัวเอง

#responsible

แนวโน้มที่จะค้นหา ตีความ ชื่นชอบ และจดจำข้อมูลใน ลักษณะที่ยืนยันความเชื่อหรือสมมติฐานที่มีอยู่ก่อนแล้ว นักพัฒนาแมชชีนเลิร์นนิงอาจเก็บรวบรวมหรือติดป้ายกำกับ ข้อมูลโดยไม่ตั้งใจในลักษณะที่ส่งผลต่อผลลัพธ์ที่สนับสนุนความเชื่อที่มีอยู่ อคติยืนยันความคิดตัวเองเป็นรูปแบบหนึ่งของอคติแฝง

อคติของผู้ทดลองเป็นรูปแบบหนึ่งของอคติในการยืนยัน ซึ่งผู้ทดลองจะฝึกโมเดลต่อไปจนกว่าจะมีการยืนยันสมมติฐานที่มีอยู่ก่อนแล้ว

ความเป็นธรรมแบบข้อเท็จจริง

#responsible

#Metric

เมตริกความเป็นธรรมที่ตรวจสอบว่าโมเดลการจัดประเภทให้ผลลัพธ์เดียวกันสำหรับบุคคลหนึ่งกับอีกบุคคลหนึ่งซึ่งเหมือนกับบุคคลแรกหรือไม่ ยกเว้นในส่วนของแอตทริบิวต์ที่ละเอียดอ่อนอย่างน้อย 1 รายการ การประเมินโมเดลการจัดประเภทเพื่อความเป็นธรรมแบบข้อเท็จจริง เป็นวิธีหนึ่งในการระบุแหล่งที่มาของความเอนเอียงที่อาจเกิดขึ้นในโมเดล

โปรดดูข้อมูลเพิ่มเติมในแหล่งข้อมูลต่อไปนี้

ความเป็นธรรม: ความเป็นธรรมแบบข้อเท็จจริงที่ขัดแย้ง ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง
เมื่อโลกมาบรรจบกัน: การผสานรวมสมมติฐานแบบ Counterfactual ที่แตกต่างกัน ในความเท่าเทียม

อคติในการครอบคลุม

#responsible

ดูอคติในการเลือก

D

ความเท่าเทียมทางประชากร

#responsible

#Metric

เมตริกความเป็นธรรมที่ตรงตามเงื่อนไขต่อไปนี้ ผลลัพธ์ของการจัดประเภทของโมเดลไม่ขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อนที่กำหนด

ตัวอย่างเช่น หากทั้งชาวลิลิพุตและชาวโบรบดิงแนกสมัครเข้าเรียนที่มหาวิทยาลัยกลับบ์ดับดริบ ความเท่าเทียมกันทางประชากรจะเกิดขึ้นหากเปอร์เซ็นต์ของชาวลิลิพุตที่ได้รับการตอบรับเท่ากับเปอร์เซ็นต์ของชาวโบรบดิงแนกที่ได้รับการตอบรับ ไม่ว่ากลุ่มใดกลุ่มหนึ่งจะมีคุณสมบัติมากกว่าอีกกลุ่มหนึ่งโดยเฉลี่ยหรือไม่ก็ตาม

แตกต่างจากโอกาสที่เท่าเทียมกันและความเท่าเทียมกันของโอกาส ซึ่งอนุญาตให้ผลการจัดประเภทโดยรวมขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน แต่ไม่อนุญาตให้ผลการจัดประเภทสำหรับป้ายกำกับความจริงพื้นฐานที่ระบุบางอย่างขึ้นอยู่กับแอตทริบิวต์ที่ละเอียดอ่อน ดูภาพ ที่อธิบายถึงการแลกเปลี่ยนเมื่อเพิ่มประสิทธิภาพเพื่อความเท่าเทียมกันทางประชากรศาสตร์ได้ใน"การต่อสู้กับการเลือกปฏิบัติด้วยแมชชีนเลิร์นนิงที่ชาญฉลาดยิ่งขึ้น"

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ความเท่าเทียมกันทางประชากร ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง

ผลกระทบที่แตกต่าง

#responsible

การตัดสินใจเกี่ยวกับผู้คนซึ่งส่งผลกระทบต่อกลุ่มย่อยของประชากรที่แตกต่างกันอย่างไม่สมส่วน โดยปกติแล้วจะหมายถึงสถานการณ์ที่กระบวนการตัดสินใจแบบอัลกอริทึมส่งผลเสียหรือส่งผลดีต่อกลุ่มย่อยบางกลุ่มมากกว่ากลุ่มอื่นๆ

ตัวอย่างเช่น สมมติว่าอัลกอริทึมที่พิจารณาการมีสิทธิ์ของชาวลิลิพุต ในการขอสินเชื่อบ้านขนาดเล็กมีแนวโน้มที่จะจัดประเภท ชาวลิลิพุตเป็น "ไม่มีสิทธิ์" หากที่อยู่จัดส่งมีรหัสไปรษณีย์ที่เฉพาะเจาะจง หากชาวลิลิพุตแบบ Big-Endian มีแนวโน้มที่จะมี ที่อยู่จัดส่งที่มีรหัสไปรษณีย์นี้มากกว่าชาวลิลิพุตแบบ Little-Endian อัลกอริทึมนี้อาจส่งผลให้เกิดผลกระทบที่ไม่เท่าเทียมกัน

แตกต่างจากการเลือกปฏิบัติ ซึ่งมุ่งเน้นความแตกต่างที่เกิดขึ้นเมื่อลักษณะของกลุ่มย่อย เป็นอินพุตที่ชัดเจนในกระบวนการตัดสินใจของอัลกอริทึม

การเลือกปฏิบัติ

#responsible

การนำแอตทริบิวต์ที่ละเอียดอ่อนของกลุ่มตัวอย่าง มาพิจารณาในกระบวนการตัดสินใจแบบอัลกอริทึมเพื่อให้ กลุ่มย่อยต่างๆ ของผู้คนได้รับการปฏิบัติที่แตกต่างกัน

ตัวอย่างเช่น ลองพิจารณาอัลกอริทึมที่ พิจารณาการมีสิทธิ์ของชาวลิลิพุตในการขอสินเชื่อบ้านขนาดเล็กตาม ข้อมูลที่ระบุในใบสมัครขอสินเชื่อ หากอัลกอริทึมใช้ความสัมพันธ์ของ ลิลิพิวเทียนเป็น Big-Endian หรือ Little-Endian เป็นอินพุต อัลกอริทึม จะใช้การปฏิบัติที่แตกต่างกันตามมิตินั้น

แตกต่างจากผลกระทบที่ไม่เท่าเทียมกัน ซึ่งมุ่งเน้น ความแตกต่างในผลกระทบทางสังคมของการตัดสินใจตามอัลกอริทึมที่มีต่อกลุ่มย่อย โดยไม่คำนึงว่ากลุ่มย่อยเหล่านั้นจะเป็นอินพุตของโมเดลหรือไม่

คำเตือน: เนื่องจากแอตทริบิวต์ที่ละเอียดอ่อนมักจะสัมพันธ์กับฟีเจอร์อื่นๆ ที่ข้อมูลอาจมี การนำข้อมูลแอตทริบิวต์ที่ละเอียดอ่อนออกอย่างชัดเจนจึงไม่รับประกันว่าระบบจะปฏิบัติต่อกลุ่มย่อยอย่างเท่าเทียมกัน เช่น การนำแอตทริบิวต์ข้อมูลประชากรที่ละเอียดอ่อนออกจากชุดข้อมูลการฝึก ที่ยังคงมีรหัสไปรษณีย์เป็นฟีเจอร์อาจช่วยแก้ปัญหาการ เลือกปฏิบัติต่อกลุ่มย่อย แต่ก็ยังอาจมี ผลกระทบที่ไม่เท่าเทียมกันต่อกลุ่มเหล่านี้ เนื่องจาก รหัสไปรษณีย์อาจทำหน้าที่เป็นพร็อกซีสำหรับข้อมูล ประชากรอื่นๆ

E

ความเท่าเทียมกันในโอกาส

#responsible

#Metric

เมตริกความเป็นธรรมเพื่อประเมินว่าโมเดล คาดการณ์ผลลัพธ์ที่ต้องการได้ดีเท่าๆ กันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่ละเอียดอ่อนหรือไม่ กล่าวอีกนัยหนึ่งคือ หากคลาสที่เป็นบวกคือผลลัพธ์ที่ต้องการสำหรับโมเดล เป้าหมายคือการทำให้อัตราผลบวกจริงเท่ากันสำหรับทุกกลุ่ม

ความเท่าเทียมกันของโอกาสเกี่ยวข้องกับอัตราส่วนที่เท่ากัน ซึ่งกำหนดให้ทั้งอัตราผลบวกจริงและ อัตราผลบวกลวงต้องเท่ากันสำหรับทุกกลุ่ม

สมมติว่ามหาวิทยาลัยกลับดับดริบรับทั้งชาวลิลิปุตและชาวบรอบดิงแนก เข้าโปรแกรมคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมของชาวลิลิพุตมี หลักสูตรที่แข็งแกร่งสำหรับชั้นเรียนคณิตศาสตร์ และนักเรียนส่วนใหญ่ มีคุณสมบัติเหมาะสมสำหรับโปรแกรมมหาวิทยาลัย โรงเรียนมัธยมศึกษาของชาวบร็อบดิงแน็กไม่มี ชั้นเรียนคณิตศาสตร์เลย และด้วยเหตุนี้ นักเรียนของพวกเขาจึงมี คุณสมบัติน้อยกว่ามาก โอกาสที่เท่าเทียมกันจะเกิดขึ้นสำหรับป้ายกำกับที่ต้องการ "รับเข้า" ในเรื่องสัญชาติ (ลิลิพุตหรือบร็อบดิงแนก) หากนักเรียนที่มีคุณสมบัติเหมาะสมมีโอกาสเท่ากันที่จะได้รับการรับเข้า ไม่ว่าจะเป็นชาวลิลิพุตหรือชาวบร็อบดิงแนก

ตัวอย่างเช่น สมมติว่ามีชาวลิลิพุต 100 คนและชาวโบรบดิงแนก 100 คนสมัครเข้าเรียนที่ มหาวิทยาลัยกลับบ์ดับดริบ และการตัดสินใจรับเข้าเรียนมีดังนี้

ตารางที่ 1 ผู้สมัครจากลิลิพุต (90% มีคุณสมบัติ)

	เข้าเกณฑ์	คุณสมบัติไม่ครบ
ยอมรับ	45	3
ถูกปฏิเสธ	45	7
รวม	90	10
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 7/10 = 70% เปอร์เซ็นต์รวมของนักเรียนชาวลิลิพุตที่ได้รับการตอบรับ: (45+3)/100 = 48%

ตารางที่ 2 ผู้สมัครจาก Brobdingnag (10% มีคุณสมบัติ):

	เข้าเกณฑ์	คุณสมบัติไม่ครบ
ยอมรับ	5	9
ถูกปฏิเสธ	5	81
รวม	10	90
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 81/90 = 90% เปอร์เซ็นต์รวมของนักเรียน Brobdingnagian ที่ได้รับการตอบรับ: (5+9)/100 = 14%

ตัวอย่างข้างต้นเป็นไปตามความเท่าเทียมกันในโอกาสที่จะได้รับการยอมรับ ของนักเรียน/นักศึกษาที่มีคุณสมบัติเหมาะสม เนื่องจากทั้งชาวลิลิพุตและชาวบร็อบดิงแนก มีโอกาส 50% ที่จะได้รับการตอบรับ

แม้ว่าโอกาสจะเท่าเทียมกัน แต่เมตริกความเป็นธรรม 2 รายการต่อไปนี้ ยังไม่เป็นไปตามข้อกำหนด

ความเท่าเทียมกันทางประชากรศาสตร์: ชาวลิลิพุตและชาวบร็อบดิงแนกจะได้รับการตอบรับเข้ามหาวิทยาลัยในอัตราที่แตกต่างกัน โดยนักเรียนชาวลิลิพุตได้รับการตอบรับ 48% แต่นักเรียนชาวบร็อบดิงแนกได้รับการตอบรับเพียง 14%
โอกาสที่เท่าเทียมกัน: แม้ว่านักเรียน/นักศึกษาชาวลิลิพุต และชาวบร็อบดิงแนกที่มีคุณสมบัติเหมาะสมจะมีโอกาสได้รับการตอบรับเท่ากัน แต่ข้อจำกัดเพิ่มเติมที่ว่านักเรียน/นักศึกษาชาวลิลิพุตและ ชาวบร็อบดิงแนกที่ไม่มีคุณสมบัติเหมาะสมจะมีโอกาสถูกปฏิเสธเท่ากันนั้นไม่เป็นจริง ชาวลิลิปุตที่ไม่ผ่านเกณฑ์มีอัตราการปฏิเสธ 70% ส่วนชาวบร็อบดิงแน็กที่ไม่ผ่านเกณฑ์มีอัตราการปฏิเสธ 90%

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ความเท่าเทียมกันของ โอกาส ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง

โอกาสที่เท่ากัน

#responsible

#Metric

เมตริกความเป็นธรรมเพื่อประเมินว่าโมเดลคาดการณ์ผลลัพธ์ได้ดีเท่ากันสำหรับค่าทั้งหมดของแอตทริบิวต์ที่ละเอียดอ่อนหรือไม่ โดยคำนึงถึงทั้งคลาสบวกและคลาสลบ ไม่ใช่แค่คลาสใดคลาสหนึ่งเท่านั้น กล่าวคือ อัตราผลบวกจริง และอัตราผลลบลวงควรเท่ากันสำหรับ ทุกกลุ่ม

โอกาสที่เท่าเทียมกันเกี่ยวข้องกับความเท่าเทียมกันของโอกาส ซึ่งมุ่งเน้นเฉพาะ อัตราข้อผิดพลาดสำหรับคลาสเดียว (บวกหรือลบ)

ตัวอย่างเช่น สมมติว่ามหาวิทยาลัยกลับดับดริบรับทั้งชาวลิลิพุตและชาวบร็อบดิงแนกเข้าเรียนในหลักสูตรคณิตศาสตร์ที่เข้มงวด โรงเรียนมัธยมของชาวลิลิพุต มีหลักสูตรที่แข็งแกร่งสำหรับชั้นเรียนคณิตศาสตร์ และนักเรียนส่วนใหญ่ มีคุณสมบัติเหมาะสมสำหรับโปรแกรมมหาวิทยาลัย โรงเรียนมัธยมของชาวบร็อบดิงแนกไม่มีชั้นเรียนคณิตศาสตร์เลย และด้วยเหตุนี้ นักเรียนจำนวนน้อยมากจึงมีคุณสมบัติเหมาะสม ความน่าจะเป็นที่เท่ากันจะเกิดขึ้นได้ก็ต่อเมื่อไม่ว่าผู้สมัครจะเป็นชาวลิลิปุตหรือชาวบร็อบดิงแน็ก หากมีคุณสมบัติครบถ้วน ก็มีโอกาสได้รับการยอมรับให้เข้าร่วมโปรแกรมเท่ากัน และหากไม่มีคุณสมบัติครบถ้วน ก็มีโอกาสถูกปฏิเสธเท่ากัน

สมมติว่าชาวลิลิปุต 100 คนและชาวบร็อบดิงแน็ก 100 คนสมัครเข้ามหาวิทยาลัยกลับบ์ดับดริบ และมีการตัดสินใจรับเข้าเรียนดังนี้

ตารางที่ 3 ผู้สมัครจากลิลิพุต (90% มีคุณสมบัติ)

	เข้าเกณฑ์	คุณสมบัติไม่ครบ
ยอมรับ	45	2
ถูกปฏิเสธ	45	8
รวม	90	10
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติผ่านที่ได้รับการตอบรับ: 45/90 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติผ่านที่ถูกปฏิเสธ: 8/10 = 80% เปอร์เซ็นต์รวมของนักเรียนชาวลิลิพุตที่ได้รับการตอบรับ: (45+2)/100 = 47%

ตารางที่ 4 ผู้สมัครจาก Brobdingnag (10% มีคุณสมบัติ):

	เข้าเกณฑ์	คุณสมบัติไม่ครบ
ยอมรับ	5	18
ถูกปฏิเสธ	5	72
รวม	10	90
เปอร์เซ็นต์ของนักเรียนที่มีคุณสมบัติเหมาะสมที่ได้รับการตอบรับ: 5/10 = 50% เปอร์เซ็นต์ของนักเรียนที่ไม่มีคุณสมบัติเหมาะสมที่ถูกปฏิเสธ: 72/90 = 80% เปอร์เซ็นต์รวมของนักเรียนจาก Brobdingnag ที่ได้รับการตอบรับ: (5+18)/100 = 23%

โอกาสที่เท่าเทียมกันเป็นไปตามเงื่อนไขเนื่องจากนักเรียนที่มีคุณสมบัติทั้งชาวลิลิพุตและชาวบร็อบดิงแนก มีโอกาส 50% ที่จะได้รับการตอบรับ และชาวลิลิพุต และชาวบร็อบดิงแนกที่ไม่มีคุณสมบัติมีโอกาส 80% ที่จะถูกปฏิเสธ

หมายเหตุ: แม้ว่าที่นี่จะตรงตามเงื่อนไขของโอกาสที่เท่าเทียมกัน แต่ความเท่าเทียมกันทางประชากรไม่ตรงตามเงื่อนไข นักเรียนจากลิลิพุต และโบรบดิงแนกจะได้รับการตอบรับเข้าศึกษาที่มหาวิทยาลัยกลับบ์ดั๊บดริบ ในอัตราที่แตกต่างกัน โดยนักเรียนจากลิลิพุตได้รับการตอบรับ 47% และนักเรียนจาก โบรบดิงแนกได้รับการตอบรับ 23%

ความน่าจะเป็นที่เท่ากันมีการกำหนดอย่างเป็นทางการใน "ความเท่าเทียมของ โอกาสในการเรียนรู้ภายใต้การกำกับดูแล" ดังนี้ "ตัวทำนาย Ŷ มีความน่าจะเป็นที่เท่ากันเมื่อเทียบกับ แอตทริบิวต์ที่ได้รับการคุ้มครอง A และผลลัพธ์ Y หาก Ŷ และ A เป็นอิสระ โดยมีเงื่อนไขเป็น Y"

อคติของผู้ทดลอง

#responsible

ดูอคติยืนยันความคิดตัวเอง

F

ข้อจำกัดด้านความเป็นธรรม

#responsible

การใช้ข้อจำกัดกับอัลกอริทึมเพื่อให้มั่นใจว่าคำจำกัดความของความเป็นธรรมอย่างน้อย 1 รายการเป็นไปตามข้อกำหนด ตัวอย่างข้อจำกัดด้านความเป็นธรรม ได้แก่

การประมวลผลภายหลังเอาต์พุตของโมเดล
การแก้ไขฟังก์ชันการสูญเสียเพื่อรวมค่าปรับ สำหรับการละเมิดเมตริกความเป็นธรรม
การเพิ่มข้อจํากัดทางคณิตศาสตร์ลงในปัญหาการเพิ่มประสิทธิภาพโดยตรง

เมตริกความเป็นธรรม

#responsible

#Metric

คำจำกัดความทางคณิตศาสตร์ของ "ความเป็นธรรม" ที่วัดได้ ตัวอย่างเมตริกความเป็นธรรมที่ใช้กันโดยทั่วไปมีดังนี้

โอกาสที่เท่าเทียม
ความเท่าเทียมในการคาดการณ์
ความเป็นธรรมแบบข้อเท็จจริง
ความเท่าเทียมกันของข้อมูลประชากร

เมตริกความเป็นธรรมหลายรายการไม่สามารถใช้ร่วมกันได้ โปรดดูความไม่เข้ากันของเมตริกความเป็นธรรม

G

อคติในการระบุแหล่งที่มาของกลุ่ม

#responsible

การสันนิษฐานว่าสิ่งที่จริงสำหรับบุคคลหนึ่งก็จริงสำหรับทุกคน ในกลุ่มนั้นด้วย อคติในการระบุแหล่งที่มาของกลุ่มอาจรุนแรงขึ้น หากใช้การสุ่มตัวอย่างตามความสะดวก ในการเก็บรวบรวมข้อมูล ในกลุ่มตัวอย่างที่ไม่เป็นตัวแทน ระบบอาจทําการระบุแหล่งที่มา ซึ่งไม่ตรงกับความเป็นจริง

ดูอคติความเหมือนกันของกลุ่มนอก และอคติในกลุ่มด้วย นอกจากนี้ โปรดดูข้อมูลเพิ่มเติมในความเป็นธรรม: ประเภทของอคติ ในหลักสูตรเร่งรัดเกี่ยวกับแมชชีนเลิร์นนิง

H

อคติทางประวัติศาสตร์

#responsible

อคติประเภทหนึ่งที่มีอยู่แล้วในโลกและแทรกซึมเข้าไปในชุดข้อมูล อคติเหล่านี้มักจะสะท้อนถึง การเหมารวมทางวัฒนธรรมที่มีอยู่ ความไม่เท่าเทียมกันทางประชากร และอคติที่มีต่อกลุ่ม ทางสังคมบางกลุ่ม

ตัวอย่างเช่น ลองพิจารณาโมเดลการจัดประเภทที่ คาดการณ์ว่าผู้สมัครขอสินเชื่อจะผิดนัดชำระหนี้หรือไม่ ซึ่งได้รับการ ฝึกจากข้อมูลการผิดนัดชำระหนี้ย้อนหลังตั้งแต่ปี 1980 จากธนาคารท้องถิ่นใน 2 ชุมชนที่แตกต่างกัน หากผู้สมัครจากชุมชน ก ในอดีตมีแนวโน้มที่จะผิดนัดชำระหนี้มากกว่าผู้สมัครจากชุมชน ข ถึง 6 เท่า โมเดลอาจเรียนรู้จากอคติในอดีต ซึ่งส่งผลให้โมเดลมีแนวโน้มน้อยที่จะอนุมัติเงินกู้ในชุมชน ก แม้ว่าเงื่อนไขในอดีตที่ส่งผลให้อัตราการผิดนัดชำระหนี้ในชุมชนนั้นสูงขึ้นจะไม่มีความเกี่ยวข้องอีกต่อไปก็ตาม

I

อคติโดยไม่รู้ตัว

#responsible

การเชื่อมโยงหรือการคาดเดาโดยอัตโนมัติตามโมเดลความคิดและความทรงจำของบุคคล อคติแฝงอาจส่งผลต่อสิ่งต่อไปนี้

วิธีเก็บรวบรวมและจัดประเภทข้อมูล
วิธีออกแบบและพัฒนาระบบแมชชีนเลิร์นนิง

ตัวอย่างเช่น เมื่อสร้างโมเดลการจัดประเภท เพื่อระบุรูปภาพงานแต่งงาน วิศวกรอาจใช้การมีชุดสีขาว ในรูปภาพเป็นฟีเจอร์ อย่างไรก็ตาม ชุดสีขาวเป็นธรรมเนียมเฉพาะในบางยุคและบางวัฒนธรรมเท่านั้น

ดูอคติยืนยันความคิดตัวเองด้วย

ความไม่เข้ากันของเมตริกความเป็นธรรม

#responsible

#Metric

แนวคิดที่ว่าแนวคิดเรื่องความยุติธรรมบางอย่างใช้ร่วมกันไม่ได้และ ไม่สามารถตอบสนองพร้อมกันได้ ด้วยเหตุนี้ จึงไม่มีเมตริกเดียวที่ใช้ได้ทั่วไป ในการวัดความเป็นธรรม ซึ่งนำไปใช้กับปัญหา ML ทั้งหมดได้

แม้ว่าอาจดูเหมือนว่าการวัดความยุติธรรมไม่สอดคล้องกัน ไม่ได้หมายความว่าความพยายามที่จะสร้างความยุติธรรมนั้นไร้ผล แต่กลับแนะนำว่า ต้องกำหนดความเป็นธรรมตามบริบทสำหรับปัญหา ML ที่กำหนด โดยมี เป้าหมายเพื่อป้องกันอันตรายที่เฉพาะเจาะจงกับ Use Case ของปัญหา

ดูรายละเอียดเพิ่มเติมเกี่ยวกับการไม่สามารถใช้เมตริกความเป็นธรรมร่วมกันได้ที่ "On the (im)possibility of fairness"

ความเป็นธรรมต่อบุคคล

#responsible

#Metric

เมตริกความเป็นธรรมที่ตรวจสอบว่าบุคคลที่คล้ายกันได้รับการจัดประเภท ในลักษณะเดียวกันหรือไม่ ตัวอย่างเช่น Brobdingnagian Academy อาจต้องการสร้างความเท่าเทียมกันในระดับบุคคลโดยการรับประกันว่านักเรียน 2 คนที่มีคะแนนเหมือนกันและคะแนนสอบมาตรฐานมีโอกาสเท่ากันที่จะได้รับการตอบรับ

โปรดทราบว่าความเป็นธรรมในระดับบุคคลขึ้นอยู่กับวิธีที่คุณกำหนด "ความคล้ายคลึง" (ในกรณีนี้คือเกรดและคะแนนสอบ) และคุณอาจเสี่ยงต่อการ ทำให้เกิดปัญหาด้านความเป็นธรรมใหม่ๆ หากเมตริกความคล้ายคลึงพลาดข้อมูลสำคัญ (เช่น ความเข้มงวดของหลักสูตรของนักเรียน)

ดูรายละเอียดเพิ่มเติมเกี่ยวกับการพิจารณาความเป็นธรรมในแต่ละบุคคลได้ที่ "ความเป็นธรรมผ่านการรับรู้"

อคติในกลุ่ม

#responsible

การแสดงความลำเอียงต่อกลุ่มหรือลักษณะของตนเอง หากผู้ทดสอบหรือผู้ให้คะแนนเป็นเพื่อน ครอบครัว หรือเพื่อนร่วมงานของนักพัฒนาแมชชีนเลิร์นนิง อคติในกลุ่มอาจทำให้การทดสอบผลิตภัณฑ์ หรือชุดข้อมูลไม่ถูกต้อง

อคติในกลุ่มเป็นรูปแบบหนึ่งของอคติในการระบุแหล่งที่มาของกลุ่ม ดูอคติความเหมือนกันของกลุ่มนอกด้วย

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติใน หลักสูตรเร่งรัดแมชชีนเลิร์นนิง

N

อคติจากการไม่ตอบ

#responsible

ดูอคติในการเลือก

O

อคติความเหมือนกันของกลุ่มนอก

#responsible

แนวโน้มที่จะมองว่าสมาชิกนอกกลุ่มมีความคล้ายคลึงกันมากกว่าสมาชิกในกลุ่ม เมื่อเปรียบเทียบทัศนคติ คุณค่า ลักษณะบุคลิกภาพ และลักษณะอื่นๆ กลุ่มในหมายถึงผู้ที่คุณโต้ตอบด้วยเป็นประจำ กลุ่มนอกหมายถึงผู้ที่คุณไม่ได้โต้ตอบด้วยเป็นประจำ หากคุณ สร้างชุดข้อมูลโดยขอให้ผู้คนระบุแอตทริบิวต์เกี่ยวกับ กลุ่มนอก แอตทริบิวต์เหล่านั้นอาจมีความแตกต่างน้อยกว่าและเป็นแบบเหมารวมมากกว่า แอตทริบิวต์ที่ผู้เข้าร่วมระบุสำหรับผู้คนในกลุ่มของตน

ตัวอย่างเช่น ชาวลิลิพุตอาจอธิบายบ้านของชาวลิลิพุตคนอื่นๆ อย่างละเอียด โดยอ้างถึงความแตกต่างเล็กๆ น้อยๆ ในรูปแบบสถาปัตยกรรม หน้าต่าง ประตู และขนาด แต่ชาวลิลิปุตคนเดียวกันนี้อาจกล่าวว่า ชาวบร็อบดิงแน็กทุกคนอาศัยอยู่ในบ้านที่เหมือนกัน

อคติความเหมือนกันของกลุ่มนอกเป็นรูปแบบหนึ่งของอคติการระบุแหล่งที่มาของกลุ่ม

ดูอคติในกลุ่มด้วย

P

อคติจากการเข้าร่วม

#responsible

คำพ้องความหมายของอคติจากการไม่ตอบ ดูอคติในการเลือก

หลังการประมวลผล

#responsible

#fundamentals

การปรับเอาต์พุตของโมเดลหลังจากเรียกใช้โมเดลแล้ว การประมวลผลภายหลังสามารถใช้เพื่อบังคับใช้ข้อจํากัดด้านความเป็นธรรมโดยไม่ต้อง แก้ไขโมเดลด้วยตนเอง

ตัวอย่างเช่น อาจใช้การประมวลผลภายหลังกับโมเดลการจัดประเภทแบบไบนารีโดยการตั้งค่าเกณฑ์การจัดประเภทเพื่อให้ความเท่าเทียมกันของโอกาสยังคงอยู่ สําหรับแอตทริบิวต์บางอย่างโดยตรวจสอบว่าอัตราผลบวกจริง มีค่าเท่ากันสําหรับค่าทั้งหมดของแอตทริบิวต์นั้น

ความเท่าเทียมในการคาดการณ์

#responsible

#Metric

เมตริกความเป็นธรรมที่ตรวจสอบว่าสำหรับโมเดลการแยกประเภทที่กำหนด อัตราความแม่นยำเทียบเท่ากับกลุ่มย่อยที่พิจารณาหรือไม่

ตัวอย่างเช่น โมเดลที่คาดการณ์การตอบรับเข้าวิทยาลัยจะตรงตาม ความเท่าเทียมเชิงคาดการณ์สำหรับสัญชาติ หากอัตราความแม่นยำเท่ากัน สำหรับชาวลิลิปุตและชาวโบรบดิงแนก

บางครั้งเราเรียกความเท่าเทียมในการคาดการณ์ว่าความเท่าเทียมของอัตราการคาดการณ์

ดูรายละเอียดเพิ่มเติมเกี่ยวกับการเท่าเทียมในการคาดการณ์ได้ที่ "คำอธิบายคำจำกัดความของความเป็นธรรม" (ส่วนที่ 3.2.1)

ความเท่าเทียมของราคาเชิงคาดการณ์

#responsible

#Metric

อีกชื่อหนึ่งของความเท่าเทียมเชิงคาดการณ์

การประมวลผลล่วงหน้า

#responsible

การประมวลผลข้อมูลก่อนที่จะนำไปใช้ฝึกโมเดล การประมวลผลล่วงหน้าอาจ ง่ายๆ เพียงแค่การนำคำออกจากคลังข้อความภาษาอังกฤษที่ไม่ได้ อยู่ในพจนานุกรมภาษาอังกฤษ หรืออาจซับซ้อนถึงขั้นการแสดง จุดข้อมูลใหม่ในลักษณะที่กำจัดแอตทริบิวต์ที่สัมพันธ์กับแอตทริบิวต์ที่ละเอียดอ่อนให้ได้มากที่สุด การประมวลผลล่วงหน้าช่วยให้เป็นไปตามข้อจํากัดด้านความเป็นธรรมได้

พร็อกซี (แอตทริบิวต์ที่ละเอียดอ่อน)

#responsible

แอตทริบิวต์ที่ใช้แทนแอตทริบิวต์ที่ละเอียดอ่อน เช่น รหัสไปรษณีย์ของบุคคลอาจใช้เป็นตัวแทนของรายได้ เชื้อชาติ หรือกลุ่มชาติพันธุ์

R

อคติในการรายงาน

#responsible

ความถี่ที่ผู้คนเขียนถึงการกระทำ ผลลัพธ์ หรือพร็อพเพอร์ตี้ไม่ได้สะท้อนถึงความถี่ในโลกแห่งความเป็นจริงหรือระดับที่พร็อพเพอร์ตี้เป็นลักษณะเฉพาะของกลุ่มบุคคล อคติในการรายงานอาจส่งผลต่อองค์ประกอบ ของข้อมูลที่ระบบแมชชีนเลิร์นนิงเรียนรู้

เช่น ในหนังสือ คำว่าหัวเราะพบได้บ่อยกว่าคำว่าหายใจ โมเดลแมชชีนเลิร์นนิงที่ประมาณความถี่สัมพัทธ์ของ การหัวเราะและการหายใจจากคลังหนังสืออาจระบุว่า การหัวเราะพบได้บ่อยกว่าการหายใจ

ดูข้อมูลเพิ่มเติมได้ที่ความเป็นธรรม: ประเภทของอคติ ในหลักสูตรเร่งรัดแมชชีนเลิร์นนิง

S

อคติในการสุ่มตัวอย่าง

#responsible

ดูอคติในการเลือก

อคติในการเลือก

#responsible

ข้อผิดพลาดในข้อสรุปที่ได้จากข้อมูลที่สุ่มตัวอย่างเนื่องจากกระบวนการเลือก ที่สร้างความแตกต่างอย่างเป็นระบบระหว่างตัวอย่างที่สังเกตได้ในข้อมูล กับตัวอย่างที่สังเกตไม่ได้ อคติในการเลือกมีรูปแบบดังนี้

อคติจากความครอบคลุม: ประชากรที่แสดงในชุดข้อมูลไม่ตรงกับประชากรที่โมเดลแมชชีนเลิร์นนิงใช้คาดการณ์
อคติในการสุ่มตัวอย่าง: ไม่ได้รวบรวมข้อมูลแบบสุ่มจากกลุ่มเป้าหมาย
อคติจากการไม่ตอบ (หรือที่เรียกว่าอคติจากการเข้าร่วม): ผู้ใช้จาก บางกลุ่มเลือกไม่เข้าร่วมตอบแบบสำรวจในอัตราที่แตกต่างจากผู้ใช้จาก กลุ่มอื่นๆ

ตัวอย่างเช่น สมมติว่าคุณกำลังสร้างโมเดลแมชชีนเลิร์นนิงที่คาดการณ์ ความชอบภาพยนตร์ของผู้คน หากต้องการรวบรวมข้อมูลการฝึก คุณจะแจกแบบสำรวจให้ทุกคนที่นั่งแถวหน้าในโรงภาพยนตร์ ที่ฉายภาพยนตร์ ในแง่หนึ่ง วิธีนี้อาจดูเหมือนเป็นวิธีที่สมเหตุสมผลในการรวบรวมชุดข้อมูล แต่การเก็บรวบรวมข้อมูลในรูปแบบนี้อาจทำให้เกิดอคติในการเลือกในรูปแบบต่อไปนี้

อคติในการครอบคลุม: การสุ่มตัวอย่างจากประชากรที่เลือกดูภาพยนตร์อาจทำให้การคาดการณ์ของโมเดลไม่สามารถสรุปผลไปยังผู้ที่ไม่ได้แสดงความสนใจในภาพยนตร์ในระดับนั้นได้
อคติในการสุ่มตัวอย่าง: แทนที่จะสุ่มตัวอย่างจากประชากรเป้าหมาย (ทุกคนที่อยู่ในโรงภาพยนตร์) คุณกลับสุ่มตัวอย่างเฉพาะคนที่นั่งแถวหน้า เป็นไปได้ว่าผู้ที่นั่งแถวหน้าจะสนใจภาพยนตร์มากกว่าผู้ที่นั่งแถวอื่นๆ
อคติจากการไม่ตอบ: โดยทั่วไปแล้ว ผู้ที่มีความคิดเห็นอย่างชัดเจนมักจะตอบแบบสำรวจที่ไม่บังคับบ่อยกว่าผู้ที่มีความคิดเห็นแบบกลางๆ เนื่องจากแบบสำรวจภาพยนตร์เป็นแบบไม่บังคับ คำตอบจึงมีแนวโน้มที่จะสร้างการกระจายแบบ 2 โหมดมากกว่าการกระจายแบบปกติ (รูประฆัง)

แอตทริบิวต์ที่มีความละเอียดอ่อน

#responsible

คุณลักษณะของมนุษย์ที่อาจได้รับการพิจารณาเป็นพิเศษด้วยเหตุผลทางกฎหมาย จริยธรรม สังคม หรือส่วนบุคคล

U

การไม่รับรู้ (ต่อแอตทริบิวต์ที่มีความละเอียดอ่อน)

#responsible

สถานการณ์ที่แอตทริบิวต์ที่ละเอียดอ่อนมีอยู่ แต่ไม่ได้รวมอยู่ในข้อมูลการฝึก เนื่องจากแอตทริบิวต์ที่ละเอียดอ่อน มักจะมีความสัมพันธ์กับแอตทริบิวต์อื่นๆ ของข้อมูล โมเดลที่ได้รับการฝึก โดยไม่ทราบเกี่ยวกับแอตทริบิวต์ที่ละเอียดอ่อนจึงอาจยังคงมีผลกระทบที่ไม่เท่าเทียมกันเกี่ยวกับแอตทริบิวต์นั้น หรือละเมิดข้อจํากัดด้านความเป็นธรรมอื่นๆ