แมชชีนเลิร์นนิงจะง่ายขึ้นมากหากเส้นโค้งการสูญเสียทั้งหมดมีลักษณะเช่นนี้เมื่อคุณฝึกโมเดลเป็นครั้งแรก
แต่น่าเสียดายที่เส้นโค้งการสูญเสียมักตีความได้ยาก ใช้ความรู้เกี่ยวกับเส้นโค้งการสูญเสียเพื่อแก้ปัญหาในหน้านี้
แบบฝึกหัดที่ 1: เส้นโค้งการสูญเสียแบบสั่น
คุณสามารถทําสิ่งใดได้บ้าง3 อย่างเพื่อพยายามปรับปรุงเส้นโค้งการสูญเสียที่แสดงในรูปที่ 21
ตรวจสอบข้อมูลกับสคีมาข้อมูลเพื่อตรวจหาตัวอย่างที่ไม่ถูกต้อง แล้วนำตัวอย่างที่ไม่ถูกต้องออกจากชุดการฝึก
ใช่ นี่เป็นแนวทางปฏิบัติแนะนำสำหรับทุกรุ่น
ลดอัตราการเรียนรู้
ใช่ การลดอัตราการเรียนรู้มักเป็นความคิดที่ดีเมื่อแก้ไขข้อบกพร่องของการฝึก
ลดชุดการฝึกให้มีตัวอย่างที่เชื่อถือได้เพียงไม่กี่รายการ
แม้ว่าเทคนิคนี้อาจฟังดูไม่เป็นธรรมชาติ แต่จริงๆ แล้วเป็นแนวคิดที่ดี สมมติว่าโมเดลมาบรรจบกันที่ชุดตัวอย่างขนาดเล็กที่เชื่อถือได้ คุณก็สามารถค่อยๆ เพิ่มตัวอย่างอื่นๆ ได้ โดยอาจค้นพบว่าตัวอย่างใดทําให้เส้นโค้งการสูญเสียสั่นไหว
เพิ่มจำนวนตัวอย่างในชุดการฝึก
แนวคิดนี้น่าดึงดูดใจ แต่แทบจะแก้ปัญหาไม่ได้เลย
เพิ่มอัตราการเรียนรู้
โดยทั่วไป หลีกเลี่ยงการเพิ่มอัตราการเรียนรู้เมื่อเส้นโค้งการเรียนรู้ของโมเดลบ่งบอกถึงปัญหา
แบบฝึกหัดที่ 2 เส้นโค้งการสูญเสียที่เพิ่มขึ้นอย่างรวดเร็ว
ข้อความต่อไปนี้มี2 ข้อความใดที่ระบุสาเหตุที่เป็นไปได้ของผลขาดทุนที่เพิ่มขึ้นอย่างรวดเร็วดังที่แสดงในรูปที่ 22
ข้อมูลอินพุตมี NaN อย่างน้อย 1 รายการ เช่น ค่าที่เกิดจากการหารด้วย 0
ปัญหานี้เกิดขึ้นบ่อยกว่าที่คุณคิด
ข้อมูลอินพุตมีค่าผิดปกติจำนวนมาก
บางครั้งการสับเปลี่ยนกลุ่มที่ไม่เหมาะสมอาจทําให้กลุ่มหนึ่งมีค่าที่ผิดปกติจำนวนมาก
อัตราการเรียนรู้ต่ำเกินไป
อัตราการเรียนรู้ที่ต่ำมากอาจเพิ่มเวลาการฝึก แต่ไม่ใช่สาเหตุของเส้นโค้งการสูญเสียที่แปลกประหลาด
อัตราการปรับค่าใช้จ่ายสูงเกินไป
จริงอยู่ การปรับให้เหมาะสมที่สูงมากอาจทําให้โมเดลไม่บรรจบ แต่จะไม่ทําให้เกิดเส้นโค้งการสูญเสียที่แปลกประหลาดดังที่แสดงในรูปที่ 22
แบบฝึกหัดที่ 3 การสูญเสียในทดสอบแตกต่างจากการสูญเสียในการฝึก
ข้อความข้อใดต่อไปนี้ระบุสาเหตุของความแตกต่างนี้ระหว่างเส้นโค้งการสูญเสียของชุดข้อมูลการฝึกอบรมและชุดทดสอบได้ดีที่สุด
โมเดลกำลังปรับให้พอดีกับชุดข้อมูลการฝึกมากเกินไป
ใช่ อาจเป็นเช่นนั้น ทางแก้ปัญหาที่เป็นไปได้มีดังนี้
- ทําให้โมเดลเรียบง่ายขึ้น ซึ่งอาจทำได้โดยการลดจํานวนฟีเจอร์
- เพิ่มอัตราการทำให้เป็นปกติ
- ตรวจสอบว่าชุดข้อมูลการฝึกอบรมและชุดทดสอบมีความเท่าเทียมกันทางสถิติ
อัตราการเรียนรู้สูงเกินไป
หากอัตราการเรียนรู้สูงเกินไป เส้นโค้งการสูญเสียของชุดข้อมูลการฝึกอบรมก็อาจไม่เป็นไปตามที่ควรจะเป็น
ตัวอย่างที่ 4 เส้นโค้งการสูญเสียค้าง
ข้อความข้อใดต่อไปนี้น่าจะเป็นคำอธิบายที่เป็นไปได้มากที่สุดสำหรับเส้นโค้งการสูญเสียที่ผันผวนซึ่งแสดงในรูปที่ 24
ชุดการฝึกอบรมมีลําดับตัวอย่างที่ซ้ำกัน
กรณีนี้เป็นไปได้ ตรวจสอบว่าคุณสับตัวอย่างอย่างเพียงพอ
อัตราการปรับค่าใช้จ่ายสูงเกินไป
ปัญหานี้ไม่น่าใช่สาเหตุ
ชุดข้อมูลการฝึกมีฟีเจอร์มากเกินไป
ปัญหานี้ไม่น่าใช่สาเหตุ