หลักสูตรข้อขัดข้องของแมชชีนเลิร์นนิงเวอร์ชันใหม่ที่ได้รับการปรับปรุงจะพร้อมให้บริการในเดือนสิงหาคม 2024 โปรดติดตามต่อไป
มีการข้ามหรือไม่
ก่อนที่คุณจะดูวิดีโอหรืออ่านเอกสาร โปรดทำแบบฝึกหัดนี้ให้เสร็จสมบูรณ์
ซึ่งจะสำรวจการใช้การข้ามฟีเจอร์มากเกินไป
งานที่ 1: เรียกใช้โมเดลตามที่เป็นอยู่ โดยใช้ฟีเจอร์ข้ามผลิตภัณฑ์ที่ระบุทั้งหมด มีความแปลกใจใดๆ หรือไม่เมื่อโมเดลมีความเหมาะสมกับข้อมูล
ปัญหาคืออะไร
งานที่ 2: ลองนำฟีเจอร์ข้ามผลิตภัณฑ์ที่หลากหลายออกเพื่อปรับปรุงประสิทธิภาพ (แม้ว่าจะเพียงเล็กน้อย) ทำไมการนำฟีเจอร์ออก
จะช่วยปรับปรุงประสิทธิภาพ
(คำตอบจะปรากฏที่ด้านล่างของแบบฝึกหัด)
คลิกไอคอนบวกสำหรับคำตอบของงานที่ 1
น่าประหลาดใจที่ขอบเขตการตัดสินใจของโมเดลดูแปลกประหลาด โดยเฉพาะอย่างยิ่ง พื้นที่ด้านบนซ้ายที่บ่งชี้ว่าเป็นสีน้ำเงิน แม้ว่าจะไม่มีการสนับสนุนที่มองเห็นได้ในข้อมูลดังกล่าว
โปรดสังเกตความหนาสัมพัทธ์ของเส้น 5 เส้นที่เริ่มจาก INPUT ถึง OUTPUT
เส้นเหล่านี้แสดงน้ำหนักสัมพัทธ์ของคุณลักษณะห้าอย่าง
เส้นที่เริ่มจาก X1 และ X2 หนากว่าเส้นที่มาจากฟีเจอร์ข้ามผ่าน ดังนั้น การกากบาทคุณลักษณะจึงให้ส่วน
น้อยกว่าคุณลักษณะปกติ (แบบไม่มีการครอส) มาก
คลิกไอคอนบวกสำหรับคำตอบของงานที่ 2
การนำการกากบาทฟีเจอร์ทั้งหมดออกช่วยให้ได้โมเดลที่สมเหตุสมผลมากขึ้น (ไม่มีขอบเขตโค้งที่ชี้นำถึงการเน้นส่วนเกินอีกต่อไป) และทำให้การสูญเสียการทดสอบมาบรรจบกัน
หลังจากการทำซ้ำ 1,000 ครั้ง การทดสอบที่สูญเสียไปควรมีค่าต่ำกว่าช่วงที่ฟีเจอร์กากบาททำงานเล็กน้อย (แม้ว่าผลลัพธ์อาจแตกต่างกันไปเล็กน้อย ขึ้นอยู่กับชุดข้อมูล)
โดยพื้นฐานแล้ว ข้อมูลในแบบฝึกหัดนี้คือข้อมูลเชิงเส้นบวกกับสัญญาณรบกวน
หากเราใช้โมเดลที่ซับซ้อนเกินไป เช่น โมเดลที่มีกากบาทมากเกินไป เราจะให้โอกาสนั้นในการใส่สัญญาณรบกวนในข้อมูลการฝึก ซึ่งมักจะต้องใช้ต้นทุนในการทำให้โมเดลทำงานได้ไม่ดีกับข้อมูลทดสอบ