AutoML: เริ่มต้นใช้งาน

หากกำลังคิดจะใช้ AutoML คุณอาจมีคำถามว่า ใช้งานได้จริง และมีขั้นตอนอย่างไรเพื่อเริ่มต้นใช้งาน ส่วนนี้จะเจาะลึกมากขึ้น เป็นรูปแบบทั่วไปของ AutoML สำรวจวิธีการทำงานของ AutoML และตรวจสอบขั้นตอน คุณอาจต้องดำเนินการก่อนจึงจะเริ่มใช้ AutoML สำหรับโปรเจ็กต์ได้

เครื่องมือ AutoML

เครื่องมือ AutoML แบ่งออกเป็น 2 หมวดหมู่หลักดังนี้

  • เครื่องมือที่ไม่ต้องเขียนโค้ดมักจะอยู่ในรูปแบบเว็บแอปพลิเคชัน ซึ่งให้คุณกำหนดค่าและทำการทดสอบผ่านอินเทอร์เฟซผู้ใช้เพื่อค้นหา ซึ่งเป็นโมเดลที่ดีที่สุดสำหรับข้อมูลโดยไม่ต้องเขียนโค้ดใดๆ
  • เครื่องมือ API และ CLI มีฟีเจอร์การทำงานอัตโนมัติขั้นสูง แต่ต้องมีมากกว่านี้ (บางครั้งก็มีความสำคัญกว่ามาก) ความเชี่ยวชาญด้านการเขียนโปรแกรมและ ML

เครื่องมือ AutoML ที่ต้องมีการเขียนโค้ดนั้นมีประสิทธิภาพและยืดหยุ่นกว่า เครื่องมือที่ไม่จำเป็นต้องเขียนโค้ด แต่ก็อาจใช้งานได้ยากกว่า โมดูลนี้โฟกัส บนตัวเลือกแบบไม่จำเป็นต้องเขียนโค้ดสำหรับการพัฒนาโมเดล แต่โปรดทราบว่า API และ CLI ที่มีประโยชน์หากคุณต้องการการทำงานอัตโนมัติที่ปรับแต่งเอง

เวิร์กโฟลว์ AutoML

ลองมาดูเวิร์กโฟลว์ทั่วไปของ ML และดูว่าสิ่งต่างๆ ทำงานอย่างไรเมื่อคุณใช้ AutoML ขั้นตอนระดับสูงในเวิร์กโฟลว์นั้นเหมือนกับขั้นตอนที่คุณใช้ การฝึกอบรมที่กำหนดเอง ความแตกต่างหลักๆ คือ AutoML จัดการงานบางอย่างให้คุณ

คำจำกัดความของปัญหา

ขั้นตอนแรกในเวิร์กโฟลว์ ML คือการกำหนดปัญหา เมื่อคุณใช้ AutoML ให้ดูแลให้เครื่องมือที่คุณเลือกรองรับ ของโปรเจ็กต์ ML เครื่องมือ AutoML ส่วนใหญ่รองรับ อัลกอริทึมแมชชีนเลิร์นนิง และประเภทอินพุต

สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการตีกรอบปัญหา โปรดดูที่โมดูลใน ข้อมูลเบื้องต้นเกี่ยวกับการจัดกรอบปัญหาแมชชีนเลิร์นนิง

การรวบรวมข้อมูล

ก่อนที่จะเริ่มทำงานกับเครื่องมือ AutoML คุณจะต้องรวบรวมข้อมูลก่อน ไว้ในแหล่งข้อมูลเดียว โปรดดูเอกสารประกอบของผลิตภัณฑ์ว่า เครื่องมือของคุณรองรับทั้งแหล่งข้อมูล ประเภทข้อมูลในชุดข้อมูล ขนาด ของชุดข้อมูล

การจัดเตรียมข้อมูล

การเตรียมข้อมูลเป็นส่วนที่เครื่องมือ AutoML ช่วยคุณได้ สามารถทำทุกอย่างได้โดยอัตโนมัติ ดังนั้น โปรดลงมือทำงานก่อน นำเข้าข้อมูลลงในเครื่องมือได้ การเตรียมข้อมูลสําหรับ AutoML คล้ายกับ สิ่งที่คุณต้องทำเพื่อฝึกโมเดลด้วยตนเอง หากคุณต้องการทราบข้อมูลเพิ่มเติม เกี่ยวกับวิธีเตรียมข้อมูลสำหรับการฝึกอบรม โปรดดูที่ "การเตรียมข้อมูล"

ดูข้อมูลเพิ่มเติมเกี่ยวกับการเตรียมข้อมูลได้ที่ การทำงานกับข้อมูลตัวเลข และ การทำงานกับข้อมูลเชิงหมวดหมู่ โมดูล

ก่อนนำเข้าข้อมูลสำหรับการฝึก AutoML คุณจะต้องดำเนินการเหล่านี้ให้เสร็จสิ้น ขั้นตอน:

  • ติดป้ายกำกับข้อมูล

    ทุกตัวอย่างในชุดข้อมูลต้องมีป้ายกำกับ

  • ล้างและจัดรูปแบบข้อมูล

    ข้อมูลในชีวิตจริงมักจะดูสับสน คุณจึงควรล้างข้อมูลก่อนใช้งาน ได้ แม้จะใช้ AutoML แล้ว คุณยังต้องกำหนดวิธีจัดการที่ดีที่สุดสำหรับ ชุดข้อมูลและปัญหาที่เจาะจง การดำเนินการนี้อาจต้องมีการสำรวจและ มีโอกาสเรียกใช้ AutoML หลายรายการก่อนที่คุณจะได้รับผลลัพธ์ที่ดีที่สุด

  • เปลี่ยนรูปแบบฟีเจอร์

    เครื่องมือ AutoML บางรายการจะจัดการการเปลี่ยนรูปแบบฟีเจอร์บางอย่างให้คุณ แต่หาก เครื่องมือที่คุณใช้อยู่ไม่รองรับการแปลงฟีเจอร์ที่คุณต้องการ หรือ รองรับแท็กได้ไม่ดี คุณอาจต้องดำเนินการเปลี่ยนรูปแบบล่วงหน้า

การพัฒนาโมเดล (ด้วย AutoML แบบไม่เขียนโค้ด)

AutoML จะทำงานให้คุณระหว่างการฝึก แต่ก่อนจะเริ่มต้น คุณต้องกำหนดค่าการทดสอบ วิธีตั้งค่าการฝึก AutoML คุณจะต้องระบุขั้นตอนระดับสูงต่อไปนี้

  1. นำเข้าข้อมูล

    โปรดระบุแหล่งข้อมูลเพื่อนําเข้าข้อมูล ระหว่างการนำเข้า เครื่องมือ AutoML จะกำหนดประเภทข้อมูลเชิงความหมายให้กับค่าข้อมูลแต่ละค่า

  2. วิเคราะห์ข้อมูล

    ผลิตภัณฑ์ AutoML มักจะมีเครื่องมือวิเคราะห์ชุดข้อมูลในช่วงก่อนและ หลังการฝึกอบรม ตามแนวทางปฏิบัติแนะนำ คุณอาจต้องการใช้เครื่องมือวิเคราะห์เหล่านี้ เพื่อทำความเข้าใจและยืนยันข้อมูลของคุณก่อนที่จะเริ่มเรียกใช้ AutoML

  3. ปรับแต่งข้อมูล

    เครื่องมือ AutoML มักมีกลไกที่ช่วยให้คุณปรับแต่งข้อมูล และก่อนการฝึก ต่อไปนี้คืองาน 2-3 อย่างที่คุณอาจต้องดำเนินการให้เสร็จ เพื่อปรับแต่งข้อมูล ดังนี้

    • การตรวจสอบเชิงความหมาย: ในระหว่างการนำเข้า เครื่องมือ AutoML จะพยายามระบุ ประเภทความหมายที่ถูกต้องสำหรับแต่ละฟีเจอร์ แต่นี่เป็นเพียงการคาดเดาเท่านั้น คุณควรตรวจสอบประเภทที่กำหนดไว้สำหรับฟีเจอร์ทั้งหมดและทำการเปลี่ยนแปลง หากมีการกำหนดอย่างไม่ถูกต้อง

      ตัวอย่างเช่น คุณเก็บรหัสไปรษณีย์เป็นตัวเลขในคอลัมน์ใน ฐานข้อมูลของคุณ ระบบ AutoML ส่วนใหญ่จะตรวจจับข้อมูลเป็นแบบต่อเนื่อง ที่เป็นตัวเลข ค่านี้จะไม่ถูกต้องสำหรับรหัสไปรษณีย์และผู้ใช้ อาจต้องการเปลี่ยนประเภททางอรรถศาสตร์เป็นเชิงหมวดหมู่มากกว่า อย่างต่อเนื่องสำหรับคอลัมน์ฟีเจอร์นี้

    • การเปลี่ยนรูปแบบ: เครื่องมือบางอย่างช่วยให้ผู้ใช้ปรับแต่งข้อมูลได้ การเปลี่ยนรูปแบบเป็นส่วนหนึ่งของกระบวนการปรับเกณฑ์การค้นหา บางครั้งก็เป็นเช่นนั้น จำเป็นเมื่อชุดข้อมูลมีฟีเจอร์การคาดการณ์ที่จำเป็นต้อง ถูกเปลี่ยนรูปแบบหรือรวมกันในลักษณะที่ทำให้เครื่องมือ AutoML ทำได้ยาก ตัดสินใจได้โดยไม่ต้องใช้ความช่วยเหลือ

      เช่น ลองพิจารณาชุดข้อมูลที่พักอาศัยที่คุณใช้ในการคาดการณ์ ราคาลดสำหรับบ้าน สมมติว่ามีฟีเจอร์ที่แสดงถึง รายละเอียดของรายการบ้านชื่อ description และ ต้องการใช้ข้อมูลนี้เพื่อสร้างฟีเจอร์ใหม่ชื่อ description_length ระบบ AutoML บางระบบมีวิธีในการใช้ การเปลี่ยนรูปแบบ สำหรับตัวอย่างนี้ อาจมีฟังก์ชัน LENGTH เพื่อสร้างฟีเจอร์ความยาวของคำอธิบายใหม่ดังนี้ LENGTH(description)

  4. กำหนดค่าพารามิเตอร์การเรียกใช้ AutoML

    ขั้นตอนสุดท้ายก่อนที่จะเรียกใช้การทดสอบการฝึกของคุณคือการเลือก การตั้งค่าการกำหนดค่าเพื่อบอกเครื่องมือว่าคุณต้องการฝึกโมเดลอย่างไร แม้ว่าเครื่องมือ AutoML แต่ละรายการจะมีชุดตัวเลือกการกำหนดค่าที่ไม่ซ้ำกัน งานกำหนดค่าที่สำคัญบางส่วนที่คุณอาจต้องทำมีดังนี้ เสร็จสมบูรณ์:

    • เลือกประเภทปัญหา ML ที่คุณวางแผนจะแก้ไข ตัวอย่างเช่น คุณ การแก้ปัญหาการแยกประเภทหรือการถดถอย
    • เลือกคอลัมน์ในชุดข้อมูลเป็นป้ายกำกับ
    • เลือกชุดฟีเจอร์ที่จะใช้ในการฝึกโมเดล
    • เลือกชุดอัลกอริทึม ML ที่ AutoML จะพิจารณาในการค้นหาโมเดล
    • เลือกเมตริกการประเมินที่ AutoML จะใช้เพื่อเลือกโมเดลที่ดีที่สุด

หลังจากกำหนดค่าการทดสอบ AutoML แล้ว คุณก็พร้อมเริ่มการฝึก วิ่งได้ การฝึกอาจใช้เวลาสักครู่ (ตามลำดับเวลา)

ประเมินโมเดล

หลังจากการฝึก คุณจะตรวจสอบผลลัพธ์ได้โดยใช้เครื่องมือที่ AutoML ผลิตภัณฑ์นั้นมอบเพื่อช่วยคุณในเรื่องต่อไปนี้

  • ประเมินฟีเจอร์โดยตรวจสอบเมตริกความสำคัญของฟีเจอร์
  • ทำความเข้าใจโมเดลของคุณด้วยการตรวจสอบสถาปัตยกรรมและไฮเปอร์พารามิเตอร์ที่ใช้ เพื่อสร้างเกมขึ้นมา
  • ประเมินประสิทธิภาพของโมเดลระดับบนสุดด้วยพล็อตและเมตริกที่เก็บรวบรวมในช่วง สำหรับโมเดลเอาต์พุต

การผลิต

แม้ว่าจะอยู่นอกขอบเขตของโมดูลนี้ แต่ระบบ AutoML บางส่วนสามารถช่วยคุณได้ ทดสอบและทำให้โมเดลใช้งานได้

ฝึกโมเดลอีกครั้ง

คุณอาจต้องฝึกโมเดลอีกครั้งด้วยข้อมูลใหม่ เหตุการณ์นี้อาจเกิดขึ้นหลังจากที่คุณ ประเมินการเรียกใช้การฝึก AutoML หรือหลังจากโมเดลเป็นเวอร์ชันที่ใช้งานจริงสำหรับบางรายการ แต่ไม่ว่าจะเลือกวิธีใด ระบบ AutoML ก็ช่วยฝึกอีกครั้งได้ด้วยเช่นกัน ไม่ใช่ ไม่สามารถตรวจสอบข้อมูลของคุณอีกครั้งหลังจากการเรียกใช้ AutoML และฝึกอีกครั้งด้วย ชุดข้อมูลที่ปรับปรุงแล้ว

ขั้นตอนถัดไป

ยินดีด้วยที่จบโมดูลนี้

เราขอแนะนำให้คุณสำรวจโมดูลต่างๆ ของ MLCC ตามเวลาและความสนใจของคุณ หากคุณต้องการทำตามคำสั่งซื้อที่แนะนำ เราขอแนะนำให้ไปที่โมดูลต่อไปนี้ในลำดับถัดไป ความเป็นธรรม ML