โมเดลแมชชีนเลิร์นนิง (ML) ไม่ได้มีวัตถุประสงค์โดยธรรมชาติ ผู้ปฏิบัติงาน ML ฝึกโมเดลด้วยการป้อนชุดข้อมูลของตัวอย่างการฝึก ที่เกี่ยวข้องในการจัดหาและดูแลจัดการข้อมูลนี้สามารถทำให้ การคาดคะเนมีความเสี่ยงต่ออคติ
เมื่อสร้างโมเดล สิ่งสำคัญคือการตระหนักถึงอคติทั่วไปของมนุษย์ที่อาจ ในไฟล์ Manifest ในข้อมูลของคุณ เพื่อให้คุณสามารถดำเนินการเชิงรุกเพื่อลด เอฟเฟกต์
อคติในการรายงาน
-
คำจำกัดความ
อคติในการรายงานเกิดขึ้นเมื่อความถี่ของ เหตุการณ์ พร็อพเพอร์ตี้ และ/หรือผลลัพธ์ที่บันทึกไว้ในชุดข้อมูลจะไม่ เพื่อแสดงความถี่จริงนั้นอย่างถูกต้อง ความลำเอียงนี้อาจเกิดขึ้นเนื่องจากผู้คนมีแนวโน้มที่จะมุ่งเน้นที่การบันทึกสถานการณ์ที่ผิดปกติหรือน่าจดจําเป็นพิเศษ โดยคิดว่าไม่จำเป็นต้องบันทึกเหตุการณ์ธรรมดา
-
ตัวอย่าง
โมเดลการวิเคราะห์ความรู้สึกจะได้รับการฝึกให้คาดการณ์ว่าหนังสือ รีวิวเป็นบวกหรือแง่ลบโดยอิงตามกลุ่มข้อมูลของผู้ใช้ ไปยังเว็บไซต์ยอดนิยม รีวิวส่วนใหญ่ใน ชุดข้อมูลการฝึกอบรมแสดงถึงความคิดเห็นสุดโต่ง (ผู้ตรวจสอบที่ ชอบหรือเกลียดหนังสือ) เพราะผู้คนมีแนวโน้มที่จะส่งหนังสือน้อยลง การทบทวนหนังสือ หากพวกเขาไม่ตอบสนองต่อหนังสือดังกล่าวอย่างแรงกล้า เพื่อ โมเดลก็สามารถคาดการณ์ความรู้สึกได้อย่างถูกต้องน้อยลง ที่ใช้ภาษาที่ละเอียดซับซ้อนกว่าในการอธิบายหนังสือ
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติในอดีต
-
คำจำกัดความ
การให้น้ำหนักพิเศษในอดีตเกิดขึ้นเมื่อข้อมูลประวัติ สะท้อนให้เห็นถึงความไม่เสมอภาคที่มีอยู่ในโลกในขณะนั้น
-
ตัวอย่าง
เมืองที่มีชุดข้อมูลจากช่วงทศวรรษ 1960 มีข้อมูลราคาที่อยู่อาศัย ที่แสดงถึง วิธีการให้กู้ยืมแบบเลือกปฏิบัติที่มีผลบังคับใช้ในระหว่างนั้น ทศวรรษ
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติการทำงานอัตโนมัติ
-
คำจำกัดความ
ความลำเอียงของการทำงานอัตโนมัติมักมีแนวโน้มที่จะให้ผลลัพธ์มากกว่า ที่เกิดจากระบบอัตโนมัติ ไม่ใช่แบบอัตโนมัติ โดยไม่คำนึงถึงอัตราข้อผิดพลาดของแต่ละระบบ
-
ตัวอย่าง
ผู้เชี่ยวชาญด้าน ML ที่ทํางานให้กับผู้ผลิตเฟืองราว ต่างกระตือรือร้นที่จะใช้โมเดล "ล้ำสมัย" ใหม่ที่ฝึกมาเพื่อระบุข้อบกพร่องของฟัน จนกระทั่งผู้ควบคุมโรงงานชี้ให้เห็นว่าทั้งความแม่นยำและอัตราการเรียกคืนของโมเดลนั้นต่ำกว่าของเจ้าหน้าที่ตรวจสอบถึง 15%
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติในการเลือก
การให้น้ำหนักเลือกแบบเกิดขึ้นหาก ตัวอย่างของชุดข้อมูลถูกเลือกในลักษณะที่ไม่สะท้อนถึง การเผยแพร่ในโลกแห่งความเป็นจริง ความลำเอียงในการเลือกอาจอยู่ในรูปแบบต่างๆ ซึ่งรวมถึงความลำเอียงด้านความครอบคลุม ความลำเอียงที่ไม่ตอบ และการเลือกตัวอย่าง
อคติเรื่องความครอบคลุม
-
คำจำกัดความ
ความคลาดเคลื่อนของการครอบคลุมจะเกิดขึ้นหากไม่ได้เลือกข้อมูลใน แฟชั่นที่ใช้เป็นตัวแทน
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายในอนาคตของผลิตภัณฑ์ใหม่โดยอิงตามแบบสํารวจทางโทรศัพท์ที่ดําเนินกับตัวอย่างผู้บริโภคที่ซื้อผลิตภัณฑ์ ผู้บริโภคที่เลือกซื้อผลิตภัณฑ์คู่แข่งแทน ไม่ได้รับการสำรวจ และด้วยเหตุนี้ คนกลุ่มนี้จึงไม่ได้รับ ที่แสดงในข้อมูลการฝึก
คลิก chevron_left เพื่อดูคําจํากัดความ
อคติจากการไม่ตอบ
-
คำจำกัดความ
อคติจากการไม่ตอบกลับ (หรือที่เรียกว่าอคติในการเข้าร่วม) จะเกิดขึ้นหากข้อมูลไม่ได้แสดงถึงประชากรโดยรวมเนื่องจากช่องว่างในการเข้าร่วมในกระบวนการรวบรวมข้อมูล
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ ผู้บริโภคที่ซื้อผลิตภัณฑ์คู่แข่งเพิ่มขึ้น 80% มีแนวโน้มที่จะปฏิเสธที่จะตอบแบบสอบถาม และข้อมูลของพวกเขา น้อยกว่าความเป็นจริงในตัวอย่าง
คลิก chevron_left เพื่อดูคําจํากัดความ
ความลำเอียงในการสุ่มตัวอย่าง
-
คำจำกัดความ
การให้น้ำหนักตัวอย่างจะเกิดขึ้น หากมีการสุ่มที่เหมาะสม ในระหว่างการรวบรวมข้อมูล
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ แทนที่จะใช้การกำหนดเป้าหมายผู้บริโภคแบบสุ่ม เลือกผู้บริโภค 200 คนแรกที่ตอบกลับอีเมล ซึ่งอาจเป็น กระตือรือร้นเกี่ยวกับผลิตภัณฑ์นี้มากกว่าคนทั่วไป ผู้ซื้อ
คลิก chevron_left เพื่อดูคําจํากัดความ
การให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม
การให้น้ำหนักพิเศษกับการระบุแหล่งที่มาของกลุ่ม เป็นแนวโน้มที่ผู้คนทั้งกลุ่มเข้าใจในสิ่งที่เป็นจริง เพื่อ ที่ควรจะเป็น อคติในการระบุแหล่งที่มาของกลุ่มมักปรากฏใน 2 สิ่งต่อไปนี้
อคติในกลุ่ม
-
คำจำกัดความ
อคติภายในกลุ่มคือค่ากำหนดสำหรับสมาชิกของ กลุ่มของคุณเอง คุณก็เป็นสมาชิกเช่นกัน หรือสำหรับลักษณะเฉพาะ ที่คุณแชร์ด้วย
-
ตัวอย่าง
ผู้ปฏิบัติงานด้าน ML 2 คนซึ่งฝึกโมเดลคัดกรองใบสมัครสำหรับนักพัฒนาซอฟต์แวร์มีแนวโน้มที่จะเชื่อว่าผู้สมัครที่เรียนที่สถาบันวิทยาการคอมพิวเตอร์เดียวกับตนมีคุณวุฒิมากกว่าสำหรับบทบาทดังกล่าว
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติแบบหนึ่งเดียวนอกกลุ่ม
-
คำจำกัดความ
อคติความเหมือนกันของกลุ่มภายนอกคือแนวโน้มที่จะตัดสินสมาชิกแต่ละคนในกลุ่มที่คุณไม่ได้เป็นสมาชิก หรือมองว่าลักษณะของสมาชิกกลุ่มนั้นมีความเหมือนกันมากกว่า
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML 2 คนฝึกโมเดลการคัดกรองประวัติสำหรับ นักพัฒนาซอฟต์แวร์ถูกเลือกให้เชื่อว่าผู้สมัครทุกราย ที่ไม่ได้เข้าเรียนในสถาบันด้านวิทยาการคอมพิวเตอร์จะไม่มี ความเชี่ยวชาญที่เพียงพอสำหรับบทบาทนั้น
คลิก chevron_left เพื่อดูคําจํากัดความ
การให้น้ำหนักพิเศษโดยนัย
-
คำจำกัดความ
อคติโดยปริยายเมื่อมีการตั้งสมมติฐาน โดยใช้รูปแบบการคิดและประสบการณ์ส่วนตัว ไม่จำเป็นนักสำหรับกรณีทั่วๆ ไป
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML ที่ฝึกโมเดลการจดจำท่าทางสัมผัสใช้ ส่ายหัวเป็น คุณลักษณะที่บ่งบอกว่าบุคคลหนึ่งกำลังสื่อสารคำว่า "ไม่" แต่ในบางภูมิภาคของโลก แสดงว่า "ใช่"
คลิก chevron_left เพื่อดูคําจํากัดความ
อคติยืนยันความคิดตัวเอง
-
คำจำกัดความ
การให้น้ำหนักพิเศษในการยืนยันเกิดขึ้นเมื่อเครื่องสร้างโมเดล ประมวลผลข้อมูลในลักษณะที่ยืนยันความเชื่อเดิมๆ แบบไม่รู้ตัว และสมมติฐาน
-
ตัวอย่าง
ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าว ในสุนัขตามคุณสมบัติต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อมของคุณ) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อดูแลจัดการข้อมูลการฝึกของโมเดล นักปฏิบัติได้ทิ้งฟีเจอร์ที่แสดงหลักฐานว่าสุนัขตัวเล็กเชื่อฟังโดยไม่รู้ตัว
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติของผู้ทำการทดสอบ
-
คำจำกัดความ
ความลำเอียงของผู้ทดสอบเกิดขึ้นเมื่อผู้สร้างโมเดล ฝึกโมเดลต่อไปจนกว่าจะสร้างผลลัพธ์ที่สอดคล้องกับ สมมติฐานเดิมของพวกเขา
-
ตัวอย่าง
ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าวของสุนัขโดยอิงตามลักษณะต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อม) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อโมเดลที่ผ่านการฝึกคาดการณ์มากที่สุด สุนัขพันธุ์พุดเดิลทอยให้ค่อนข้างดื้อดึง ผู้ปฏิบัติงานก็ฝึก โมเดลนี้อีกหลายครั้งจนกว่าจะได้ผลลัพธ์ที่แสดง สุนัขพันธุ์พุดเดิ้ลพันธุ์เล็กเพื่อให้มีความรุนแรงมากขึ้น
คลิก chevron_left เพื่อหาคำจำกัดความ