แมชชีนเลิร์นนิงอัตโนมัติ (AutoML)

หากเพิ่งเริ่มโปรเจ็กต์แมชชีนเลิร์นนิง (ML) ใหม่ คุณอาจสงสัยว่าการฝึกด้วยตนเองเป็นตัวเลือกเดียวในการสร้างโมเดลแมชชีนเลิร์นนิงหรือไม่ เมื่อใช้การฝึกด้วยตนเอง คุณจะเขียนโค้ดโดยใช้เฟรมเวิร์ก ML เพื่อสร้างโมเดล ในระหว่างกระบวนการนี้ คุณสามารถเลือกอัลกอริทึมที่จะสำรวจและปรับแต่งไฮเปอร์พารามิเตอร์ซ้ำๆ เพื่อค้นหาโมเดลที่เหมาะสม

แน่นอนว่าการฝึกโมเดลไม่ใช่สิ่งเดียวที่คุณต้องทำ ในทางปฏิบัติ การสร้างโมเดลแมชชีนเลิร์นนิงจากโปรโตไทป์เป็นเวอร์ชันที่ใช้งานจริงเกี่ยวข้องกับงานที่ซ้ำๆ และทักษะเฉพาะทาง เวิร์กโฟลว์ ML การสํารวจแบบง่ายมีลักษณะดังนี้

รูปที่ 1 เวิร์กโฟลว์แมชชีนเลิร์นนิงแบบง่าย
รูปที่ 1 เวิร์กโฟลว์การสำรวจแมชชีนเลิร์นนิงที่เรียบง่าย

งานซ้ำๆ - เวิร์กโฟลว์ ML อาจเกี่ยวข้องกับงานและการทดลองซ้ำๆ ตัวอย่างเช่น ในระหว่างการพัฒนาโมเดล คุณมักจะต้องสำรวจการผสมผสานอัลกอริทึมและไฮเปอร์พารามิเตอร์ต่างๆ เพื่อระบุโมเดลที่เหมาะสมที่สุด เมื่อใช้การฝึกด้วยตนเอง คุณจะเขียนโค้ดเฉพาะเพื่อฝึกโมเดล จากนั้นปรับโค้ดเพื่อทำการทดสอบกับอัลกอริทึม ML และไฮเปอร์พารามิเตอร์ต่างๆ เพื่อหาโมเดลที่ดีที่สุด สำหรับโปรเจ็กต์ขนาดเล็กหรือโปรเจ็กต์สํารวจ กระบวนการที่ต้องทำด้วยตนเองนี้อาจไม่มีปัญหา แต่สำหรับโปรเจ็กต์ขนาดใหญ่ งานซ้ำๆ เหล่านี้อาจใช้เวลานาน

ทักษะเฉพาะทาง - การพัฒนาโมเดล ML ด้วยตนเองต้องใช้ทักษะเฉพาะทาง ในทางปฏิบัติ ทีมที่วางแผนจะพัฒนาโมเดลแมชชีนเลิร์นนิงอาจไม่มีทักษะเหล่านี้ หากทีมไม่มีนักวิทยาศาสตร์ข้อมูลที่เชี่ยวชาญเฉพาะทาง การทำงานนี้ด้วยตนเองอาจไม่สามารถทำได้

แต่โชคดีที่ขั้นตอนบางอย่างในการพัฒนาโมเดลสามารถทํางานอัตโนมัติได้เพื่อลดภาระงานซ้ำๆ และความต้องการทักษะเฉพาะ การทำงานเหล่านี้โดยอัตโนมัติเป็นหัวข้อของโมดูลนี้เกี่ยวกับแมชชีนเลิร์นนิงอัตโนมัติ (AutoML)

AutoML คืออะไร

AutoML คือกระบวนการทํางานบางอย่างในเวิร์กโฟลว์แมชชีนเลิร์นนิงให้เป็นแบบอัตโนมัติ คุณอาจมอง AutoML เป็นชุดเครื่องมือและเทคโนโลยีที่ช่วยสร้างโมเดลแมชชีนเลิร์นนิงได้เร็วขึ้นและเข้าถึงผู้ใช้กลุ่มใหญ่ได้มากขึ้น แม้ว่าการทำงานอัตโนมัติจะช่วยได้ตลอดเวิร์กโฟลว์ ML แต่งานที่มักเกี่ยวข้องกับ AutoML จะเป็นงานที่รวมอยู่ในวงจรการพัฒนาโมเดลที่แสดงในรูปที่ 1 งานที่ซ้ำกันเหล่านี้ ได้แก่

  • วิศวกรรมข้อมูล
    • Feature Engineering
    • การเลือกฟีเจอร์
  • การฝึกอบรม
    • ระบุอัลกอริทึม ML ที่เหมาะสม
    • การเลือกไฮเปอร์พารามิเตอร์ที่ดีที่สุด
  • การวิเคราะห์
    • การประเมินเมตริกที่สร้างขึ้นระหว่างการฝึกอบรมตามชุดข้อมูลทดสอบและชุดข้อมูลที่ใช้ตรวจสอบ

เมื่อใช้ AutoML คุณจะมุ่งเน้นที่ปัญหาและข้อมูล ML ได้โดยไม่ต้องเลือกฟีเจอร์ ปรับแต่งไฮเปอร์พารามิเตอร์ และเลือกอัลกอริทึมที่ถูกต้อง