หลักสูตรข้อขัดข้องของแมชชีนเลิร์นนิงเวอร์ชันใหม่ที่ได้รับการปรับปรุงจะพร้อมให้บริการในเดือนสิงหาคม 2024 โปรดติดตามต่อไป

หน้านี้ได้รับการแปลโดย Cloud Translation API

การทำให้เป็นมาตรฐานเพื่อให้เรียบง่าย: การออกกำลังกายในสนามเด็กเล่น (โอเวอร์ครอสโอเวอร์)

มีการข้ามหรือไม่

ก่อนที่คุณจะดูวิดีโอหรืออ่านเอกสาร โปรดทำแบบฝึกหัดนี้ให้เสร็จสมบูรณ์ ซึ่งจะสำรวจการใช้การข้ามฟีเจอร์มากเกินไป

งานที่ 1: เรียกใช้โมเดลตามที่เป็นอยู่ โดยใช้ฟีเจอร์ข้ามผลิตภัณฑ์ที่ระบุทั้งหมด มีความแปลกใจใดๆ หรือไม่เมื่อโมเดลมีความเหมาะสมกับข้อมูล ปัญหาคืออะไร

งานที่ 2: ลองนำฟีเจอร์ข้ามผลิตภัณฑ์ที่หลากหลายออกเพื่อปรับปรุงประสิทธิภาพ (แม้ว่าจะเพียงเล็กน้อย) ทำไมการนำฟีเจอร์ออก จะช่วยปรับปรุงประสิทธิภาพ

(คำตอบจะปรากฏที่ด้านล่างของแบบฝึกหัด)

คลิกไอคอนบวกสำหรับคำตอบของงานที่ 1

น่าประหลาดใจที่ขอบเขตการตัดสินใจของโมเดลดูแปลกประหลาด โดยเฉพาะอย่างยิ่ง พื้นที่ด้านบนซ้ายที่บ่งชี้ว่าเป็นสีน้ำเงิน แม้ว่าจะไม่มีการสนับสนุนที่มองเห็นได้ในข้อมูลดังกล่าว

โปรดสังเกตความหนาสัมพัทธ์ของเส้น 5 เส้นที่เริ่มจาก INPUT ถึง OUTPUT เส้นเหล่านี้แสดงน้ำหนักสัมพัทธ์ของคุณลักษณะห้าอย่าง เส้นที่เริ่มจาก X₁ และ X₂ หนากว่าเส้นที่มาจากฟีเจอร์ข้ามผ่าน ดังนั้น การกากบาทคุณลักษณะจึงให้ส่วน น้อยกว่าคุณลักษณะปกติ (แบบไม่มีการครอส) มาก

คลิกไอคอนบวกสำหรับคำตอบของงานที่ 2

การนำการกากบาทฟีเจอร์ทั้งหมดออกช่วยให้ได้โมเดลที่สมเหตุสมผลมากขึ้น (ไม่มีขอบเขตโค้งที่ชี้นำถึงการเน้นส่วนเกินอีกต่อไป) และทำให้การสูญเสียการทดสอบมาบรรจบกัน

หลังจากการทำซ้ำ 1,000 ครั้ง การทดสอบที่สูญเสียไปควรมีค่าต่ำกว่าช่วงที่ฟีเจอร์กากบาททำงานเล็กน้อย (แม้ว่าผลลัพธ์อาจแตกต่างกันไปเล็กน้อย ขึ้นอยู่กับชุดข้อมูล)

โดยพื้นฐานแล้ว ข้อมูลในแบบฝึกหัดนี้คือข้อมูลเชิงเส้นบวกกับสัญญาณรบกวน หากเราใช้โมเดลที่ซับซ้อนเกินไป เช่น โมเดลที่มีกากบาทมากเกินไป เราจะให้โอกาสนั้นในการใส่สัญญาณรบกวนในข้อมูลการฝึก ซึ่งมักจะต้องใช้ต้นทุนในการทำให้โมเดลทำงานได้ไม่ดีกับข้อมูลทดสอบ

ทดสอบความเข้าใจ

การบรรยายผ่านวิดีโอ