แมชชีนเลิร์นนิงอัตโนมัติ (AutoML)

หากเพิ่งเริ่มโปรเจ็กต์แมชชีนเลิร์นนิง (ML) ใหม่ คุณอาจสงสัยว่าการฝึกด้วยตนเองเป็นตัวเลือกเดียวในการสร้างโมเดลแมชชีนเลิร์นนิงหรือไม่ เมื่อใช้การฝึกด้วยตนเอง คุณจะเขียนโค้ดโดยใช้เฟรมเวิร์ก ML เพื่อสร้างโมเดล ระหว่าง ในขั้นตอนนี้ คุณจะเลือกอัลกอริทึมที่จะสำรวจและปรับแต่ง ไฮเปอร์พารามิเตอร์เพื่อค้นหาโมเดลที่ถูกต้อง

แน่นอนว่าการฝึกโมเดลไม่ใช่สิ่งเดียวที่คุณต้องคำนึงถึง ในทางปฏิบัติ การสร้างโมเดลแมชชีนเลิร์นนิงจากโปรโตไทป์ไปยังเวอร์ชันที่ใช้งานจริงนั้นเกี่ยวข้องกับงานที่ซ้ำๆ และทักษะเฉพาะทาง เวิร์กโฟลว์ ML การสํารวจแบบง่ายมีลักษณะดังนี้

รูปที่ 1 เวิร์กโฟลว์แมชชีนเลิร์นนิงที่เรียบง่าย
รูปที่ 1 เวิร์กโฟลว์การสำรวจแมชชีนเลิร์นนิงที่เรียบง่าย

งานที่ทำซ้ำๆ - เวิร์กโฟลว์ ML อาจมีการทำงานซ้ำๆ และ ในการทดสอบ ตัวอย่างเช่น ในระหว่างการพัฒนาโมเดล คุณมักจะต้องสำรวจการผสมผสานอัลกอริทึมและไฮเปอร์พารามิเตอร์ต่างๆ เพื่อระบุโมเดลที่เหมาะสมที่สุด เมื่อใช้การฝึกด้วยตนเอง คุณจะเขียนโค้ดเฉพาะเพื่อฝึกโมเดล จากนั้นปรับโค้ดเพื่อทำการทดสอบด้วยอัลกอริทึม ML และไฮเปอร์พารามิเตอร์ต่างๆ เพื่อหาโมเดลที่ดีที่สุด สำหรับโปรเจ็กต์ขนาดเล็กหรือโปรเจ็กต์สํารวจ กระบวนการที่ต้องทำด้วยตนเองนี้อาจไม่มีปัญหา แต่สำหรับโปรเจ็กต์ขนาดใหญ่ งานซ้ำๆ เหล่านี้อาจใช้เวลานาน

ทักษะเฉพาะทาง - การพัฒนาโมเดล ML ด้วยตนเองต้องใช้ทักษะเฉพาะทาง ในทางปฏิบัติ บางทีมไม่ได้วางแผนพัฒนาโมเดลแมชชีนเลิร์นนิง ก็อาจมีทักษะเหล่านี้ หากทีมไม่มีนักวิทยาศาสตร์ข้อมูลที่เชี่ยวชาญเฉพาะทาง การทำงานนี้ด้วยตนเองอาจไม่สามารถทำได้

แต่โชคดีที่บางขั้นตอนในการพัฒนาโมเดลสามารถเป็นแบบอัตโนมัติได้เพื่อลด เป็นภาระการทำงานซ้ำๆ และความต้องการทักษะเฉพาะด้าน ทำให้ตัวเลือกเหล่านี้ทำงานอัตโนมัติ งานจะเป็นหัวข้อของโมดูลนี้ในแมชชีนเลิร์นนิงแบบอัตโนมัติ (AutoML)

AutoML คืออะไร

AutoML คือกระบวนการทํางานบางอย่างในเวิร์กโฟลว์แมชชีนเลิร์นนิงให้เป็นแบบอัตโนมัติ คุณอาจมอง AutoML เป็นชุดเครื่องมือและเทคโนโลยีที่ช่วยสร้างโมเดลแมชชีนเลิร์นนิงได้เร็วขึ้นและเข้าถึงผู้ใช้กลุ่มใหญ่ได้มากขึ้น แม้ว่าการทำงานอัตโนมัติจะช่วยได้ตลอดเวิร์กโฟลว์ ML แต่งานที่มักเชื่อมโยงกับ AutoML จะเป็นงานที่รวมอยู่ในวงจรการพัฒนาโมเดลที่แสดงในรูปที่ 1 งานซ้ำๆ เหล่านี้ ได้แก่

  • วิศวกรรมข้อมูล
    • Feature Engineering
    • การเลือกฟีเจอร์
  • การฝึกอบรม
    • ระบุอัลกอริทึม ML ที่เหมาะสม
    • การเลือกไฮเปอร์พารามิเตอร์ที่ดีที่สุด
  • การวิเคราะห์
    • การประเมินเมตริกที่สร้างขึ้นระหว่างการฝึกอบรมตามชุดข้อมูลทดสอบและชุดข้อมูลที่ใช้ตรวจสอบ

เมื่อใช้ AutoML คุณจะมุ่งเน้นที่ปัญหาและข้อมูล ML ได้โดยไม่ต้องกังวลเรื่องการเลือกฟีเจอร์ การปรับแต่งไฮเปอร์พารามิเตอร์ และการเลือกอัลกอริทึมที่ถูกต้อง