โมเดลแมชชีนเลิร์นนิง (ML) ไม่ได้มีวัตถุประสงค์โดยธรรมชาติ ผู้ปฏิบัติงาน ML ฝึกโมเดลด้วยการป้อนชุดข้อมูลของตัวอย่างการฝึก ที่เกี่ยวข้องในการจัดหาและดูแลจัดการข้อมูลนี้สามารถทำให้ การคาดคะเนมีความเสี่ยงต่ออคติ
เมื่อสร้างโมเดล สิ่งสำคัญคือการตระหนักถึงอคติทั่วไปของมนุษย์ที่อาจ ในไฟล์ Manifest ในข้อมูลของคุณ เพื่อให้คุณสามารถดำเนินการเชิงรุกเพื่อลด เอฟเฟกต์
อคติในการรายงาน
-
คำจำกัดความ
อคติในการรายงานเกิดขึ้นเมื่อความถี่ของ เหตุการณ์ พร็อพเพอร์ตี้ และ/หรือผลลัพธ์ที่บันทึกไว้ในชุดข้อมูลจะไม่ เพื่อแสดงความถี่จริงนั้นอย่างถูกต้อง อคตินี้อาจเกิดขึ้นได้ เพราะผู้คนมักจะให้ความสำคัญกับการบันทึกภาพสถานการณ์ ผิดปกติหรือน่าจดจำเป็นพิเศษ โดยมีสมมติฐานว่า ต้องมีการบันทึก
-
ตัวอย่าง
โมเดลการวิเคราะห์ความรู้สึกจะได้รับการฝึกให้คาดการณ์ว่าหนังสือ รีวิวเป็นบวกหรือแง่ลบโดยอิงตามกลุ่มข้อมูลของผู้ใช้ ไปยังเว็บไซต์ยอดนิยม รีวิวส่วนใหญ่ใน ชุดข้อมูลการฝึกอบรมแสดงถึงความคิดเห็นสุดโต่ง (ผู้ตรวจสอบที่ ชอบหรือเกลียดหนังสือ) เพราะผู้คนมีแนวโน้มที่จะส่งหนังสือน้อยลง การทบทวนหนังสือ หากพวกเขาไม่ตอบสนองต่อหนังสือดังกล่าวอย่างแรงกล้า เพื่อ โมเดลก็สามารถคาดการณ์ความรู้สึกได้อย่างถูกต้องน้อยลง ที่ใช้ภาษาที่ละเอียดซับซ้อนกว่าในการอธิบายหนังสือ
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติในอดีต
-
คำจำกัดความ
การให้น้ำหนักพิเศษในอดีตเกิดขึ้นเมื่อข้อมูลประวัติ สะท้อนให้เห็นถึงความไม่เสมอภาคที่มีอยู่ในโลกในขณะนั้น
-
ตัวอย่าง
เมืองที่มีชุดข้อมูลจากช่วงทศวรรษ 1960 มีข้อมูลราคาที่อยู่อาศัย ที่แสดงถึง วิธีการให้กู้ยืมแบบเลือกปฏิบัติที่มีผลบังคับใช้ในระหว่างนั้น ทศวรรษ
คลิก chevron_left เพื่อหาคำจำกัดความ
การให้น้ำหนักการทำงานอัตโนมัติ
-
คำจำกัดความ
ความลำเอียงของการทำงานอัตโนมัติมีแนวโน้มที่จะให้ผลลัพธ์ ที่เกิดจากระบบอัตโนมัติ ไม่ใช่แบบอัตโนมัติ โดยไม่คำนึงถึงอัตราข้อผิดพลาดของแต่ละระบบ
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML ที่ทำงานให้ผู้ผลิตไขควงมีความกระตือรือร้นที่จะ นำ "นวัตกรรม" ใหม่มาใช้ โมเดลที่นักเรียนฝึกให้ระบุ ฟันชำรุด จนกว่าหัวหน้าโรงงานจะชี้ว่า ทั้งความแม่นยำและอัตราการจดจำของรุ่นนั้นต่ำกว่า 15% จากเจ้าหน้าที่ตรวจสอบ
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติในการเลือก
การให้น้ำหนักเลือกแบบเกิดขึ้นหาก ตัวอย่างของชุดข้อมูลถูกเลือกในลักษณะที่ไม่สะท้อนถึง การเผยแพร่ในโลกแห่งความเป็นจริง อคติในการเลือก มีหลายรูปแบบ ซึ่งรวมถึงอคติเกี่ยวกับความครอบคลุม การให้น้ำหนักพิเศษที่ไม่ได้โต้ตอบ และการให้น้ำหนักการสุ่มตัวอย่าง
อคติเรื่องความครอบคลุม
-
คำจำกัดความ
ความคลาดเคลื่อนของการครอบคลุมจะเกิดขึ้นหากไม่ได้เลือกข้อมูลใน แฟชั่นที่ใช้เป็นตัวแทน
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์ ผู้บริโภคที่เลือกซื้อผลิตภัณฑ์คู่แข่งแทน ไม่ได้รับการสำรวจ และด้วยเหตุนี้ คนกลุ่มนี้จึงไม่ได้รับ ที่แสดงในข้อมูลการฝึก
คลิก chevron_left เพื่อหาคำจำกัดความ
การให้น้ำหนักพิเศษที่ไม่ตรงประเด็น
-
คำจำกัดความ
อคติที่ไม่ตอบกลับ (หรือเรียกอีกอย่างว่า อคติจากการเข้าร่วม) จะเกิดขึ้นหากข้อมูลกลายเป็น ไม่แสดงตัวตนเนื่องจากช่องว่างเกี่ยวกับการมีส่วนร่วมในการเก็บรวบรวมข้อมูล ขั้นตอนได้
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ ผู้บริโภคที่ซื้อผลิตภัณฑ์คู่แข่งเพิ่มขึ้น 80% มีแนวโน้มที่จะปฏิเสธที่จะตอบแบบสอบถาม และข้อมูลของพวกเขา น้อยกว่าความเป็นจริงในตัวอย่าง
คลิก chevron_left เพื่อหาคำจำกัดความ
การให้น้ำหนักพิเศษในการสุ่มตัวอย่าง
-
คำจำกัดความ
การให้น้ำหนักตัวอย่างจะเกิดขึ้น หากมีการสุ่มที่เหมาะสม ในระหว่างการรวบรวมข้อมูล
-
ตัวอย่าง
โมเดลได้รับการฝึกให้คาดการณ์ยอดขายผลิตภัณฑ์ใหม่ในอนาคตโดยอิงตาม โดยใช้แบบสำรวจทางโทรศัพท์สำหรับกลุ่ม ตัวอย่างของผู้บริโภคที่ซื้อ ผลิตภัณฑ์และตัวอย่างผู้บริโภคที่ซื้อ ผลิตภัณฑ์ แทนที่จะใช้การกำหนดเป้าหมายผู้บริโภคแบบสุ่ม เลือกผู้บริโภค 200 คนแรกที่ตอบกลับอีเมล ซึ่งอาจเป็น กระตือรือร้นเกี่ยวกับผลิตภัณฑ์นี้มากกว่าคนทั่วไป ผู้ซื้อ
คลิก chevron_left เพื่อหาคำจำกัดความ
การให้น้ำหนักการระบุแหล่งที่มาของกลุ่ม
การให้น้ำหนักพิเศษกับการระบุแหล่งที่มาของกลุ่ม เป็นแนวโน้มที่ผู้คนทั้งกลุ่มเข้าใจในสิ่งที่เป็นจริง เพื่อ ของพวกเขา อคติในการระบุแหล่งที่มาของกลุ่มมักปรากฏใน 2 สิ่งต่อไปนี้
อคติในกลุ่ม
-
คำจำกัดความ
อคติภายในกลุ่มคือค่ากำหนดสำหรับสมาชิกของ กลุ่มของคุณเอง คุณก็เป็นสมาชิกเช่นกัน หรือสำหรับลักษณะเฉพาะ ที่คุณแชร์ด้วย
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML 2 คนฝึกโมเดลการคัดกรองประวัติสำหรับ นักพัฒนาซอฟต์แวร์ถูกเลือกให้เชื่อว่าผู้สมัคร ที่เรียนในสถาบันวิทยาการคอมพิวเตอร์เดียวกับที่ทั้ง 2 เรียน เหมาะสมกับบทบาทนี้มากกว่า
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติแบบหนึ่งเดียวนอกกลุ่ม
-
คำจำกัดความ
อคติตัวเองแบบกลุ่มนอกกลุ่มมีแนวโน้มที่ การเหมารวมของสมาชิกแต่ละคนในกลุ่มที่คุณไม่ได้ เข้ากับสิ่งอื่น หรือเห็นลักษณะเฉพาะของสิ่งเหล่านั้นเหมือนกันมากขึ้น
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML 2 คนฝึกโมเดลการคัดกรองประวัติสำหรับ นักพัฒนาซอฟต์แวร์ถูกเลือกให้เชื่อว่าผู้สมัครทุกราย ที่ไม่ได้เข้าเรียนในสถาบันด้านวิทยาการคอมพิวเตอร์จะไม่มี ความเชี่ยวชาญที่เพียงพอสำหรับบทบาทนั้น
คลิก chevron_left เพื่อหาคำจำกัดความ
การให้น้ำหนักพิเศษโดยนัย
-
คำจำกัดความ
อคติโดยปริยายเมื่อมีการตั้งสมมติฐาน โดยใช้รูปแบบการคิดและประสบการณ์ส่วนตัว ไม่จำเป็นนักสำหรับกรณีทั่วๆ ไป
-
ตัวอย่าง
ผู้ปฏิบัติงาน ML ที่ฝึกโมเดลการจดจำท่าทางสัมผัสใช้ ส่ายหัวเป็น คุณลักษณะที่บ่งบอกว่าบุคคลหนึ่งกำลังสื่อสารคำว่า "ไม่" แต่ในบางภูมิภาคของโลก แสดงคำว่า "ใช่"
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติยืนยันความคิดตัวเอง
-
คำจำกัดความ
การให้น้ำหนักพิเศษในการยืนยันเกิดขึ้นเมื่อเครื่องสร้างโมเดล ประมวลผลข้อมูลในลักษณะที่ยืนยันความเชื่อเดิมๆ แบบไม่รู้ตัว และสมมติฐาน
-
ตัวอย่าง
ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าว ในสุนัขตามคุณสมบัติต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อมของคุณ) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อดูแลจัดการข้อมูลการฝึกของโมเดล ผู้ประกอบวิชาชีพทิ้งฟีเจอร์ที่มีให้โดยไม่รู้ตัว หลักฐานที่แสดงถึงสิ่งอำนวยความสะดวกในสุนัขขนาดเล็ก
คลิก chevron_left เพื่อหาคำจำกัดความ
อคติของผู้ทำการทดสอบ
-
คำจำกัดความ
ความลำเอียงของผู้ทดสอบเกิดขึ้นเมื่อผู้สร้างโมเดล ฝึกโมเดลต่อไปจนกว่าจะสร้างผลลัพธ์ที่สอดคล้องกับ สมมติฐานเดิมของพวกเขา
-
ตัวอย่าง
ผู้ปฏิบัติงานด้าน ML กำลังสร้างโมเดลที่คาดการณ์ความก้าวร้าว ในสุนัขตามคุณสมบัติต่างๆ (ความสูง น้ำหนัก สายพันธุ์ สภาพแวดล้อมของคุณ) ผู้ปฏิบัติงานเผชิญกับปัญหา สุนัขพันธุ์พุดเดิลของเล่นที่โต้ตอบได้จริงตั้งแต่เด็ก และนับจากนั้นก็มีความสัมพันธ์ มีพันธุ์ที่ชอบความก้าวร้าว เมื่อโมเดลที่ผ่านการฝึกคาดการณ์มากที่สุด สุนัขพันธุ์พุดเดิลทอยให้ค่อนข้างดื้อดึง ผู้ปฏิบัติงานฝึก โมเดลนี้อีกหลายครั้งจนกว่าจะได้ผลลัพธ์ที่แสดง สุนัขพันธุ์พุดเดิ้ลพันธุ์เล็กเพื่อให้มีความรุนแรงมากขึ้น
คลิก chevron_left เพื่อหาคำจำกัดความ