ML การปฏิบัติ: การแยกประเภทรูปภาพ

การป้องกันการใช้งานมากเกินไป

เช่นเดียวกับโมเดลแมชชีนเลิร์นนิงอื่นๆ ข้อกังวลสําคัญเมื่อฝึกโครงข่ายระบบประสาทเทียมที่แพร่หลายคือการเพิ่มประสิทธิภาพ ซึ่งก็คือโมเดลที่ปรับแต่งให้เข้ากับข้อมูลการฝึกที่เฉพาะเจาะจงซึ่งไม่สามารถประมาณตัวอย่างใหม่ๆ ได้ เทคนิค 2 ข้อที่จะป้องกันไม่ให้สร้างมากเกินไปในกรณีที่สร้าง CNN มีดังนี้

  • การเพิ่มข้อมูล: เพิ่มความหลากหลายและตัวอย่างของตัวอย่างการฝึกอบรมที่ไม่เป็นจริงโดยการเปลี่ยนรูปแบบแบบสุ่มไปยังรูปภาพที่มีอยู่ เพื่อสร้างชุดตัวแปรใหม่ (ดูรูปที่ 7) ส่วนเสริมข้อมูลมีประโยชน์อย่างยิ่งเมื่อชุดข้อมูลการฝึกอบรมเดิมค่อนข้างเล็ก
  • การปรับให้สอดคล้องตามมาตรฐาน: การสุ่มนําหน่วยออกจากโครงข่ายระบบประสาทเทียมระหว่างขั้นตอนการไล่ระดับสีของการฝึกอบรม

แผนภาพที่เพิ่มข้อมูลกับรูปภาพสุนัขภาพเดียว ซึ่งจะสร้างรูปภาพใหม่ 9 ภาพผ่านการเปลี่ยนแบบสุ่ม รูปที่ 7 การเพิ่มข้อมูลสุนัขด้วยภาพสุนัข 1 ภาพ (ตัดตอนมาจากชุดข้อมูล "Dogs vs. Cats" พร้อมใช้งานใน Kagle) ซ้าย: รูปภาพสุนัขต้นฉบับจากชุดการฝึก ขวา: รูปภาพใหม่ 9 ภาพที่สร้างจากรูปภาพดั้งเดิมโดยใช้การแปลงแบบสุ่ม