ระบบ ML การผลิต: การฝึกแบบคงที่กับแบบไดนามิก

พูดกว้างๆ ก็คือคุณสามารถฝึกโมเดลได้ 2 วิธีดังนี้

  • การฝึกแบบคงที่ (รวมถึง ที่เรียกว่าการฝึกแบบออฟไลน์) หมายความว่าคุณฝึกโมเดล เพียงครั้งเดียวเท่านั้น จากนั้นคุณก็จะแสดงโมเดลที่ฝึกแบบเดียวกันนั้นสักพัก
  • การฝึกอบรมแบบไดนามิก (รวมถึง ที่เรียกว่าการฝึกออนไลน์) หมายความว่าคุณฝึกโมเดล อย่างต่อเนื่องหรืออย่างน้อยที่สุด คุณมักจะให้บริการมากที่สุด โมเดลที่เพิ่งฝึกเมื่อเร็วๆ นี้
รูปที่ 2 แป้งดิบจะสร้างขนมปังที่เหมือนกัน 3 ก้อน
รูปที่ 2 การฝึกแบบคงที่ ฝึกครั้งเดียว แสดงโมเดลที่สร้างขึ้นเดียวกัน หลายครั้ง (ภาพโดย Pexels และโดยแฟนซีคราฟ1)

 

วันที่ รูปที่ 3 แป้งดิบจะสร้างก้อนขนมปังที่แตกต่างออกไปเล็กน้อย
            ในแต่ละครั้ง
รูปที่ 3 การฝึกอบรมแบบไดนามิก ฝึกซ้ำบ่อยๆ ให้บริการมากที่สุด โมเดลที่เพิ่งสร้างขึ้น (ภาพโดย Pexels และโดย Couleur)

 

ตาราง 1 ข้อดีและข้อเสียหลักๆ

การฝึกแบบคงที่ การฝึกอบรมแบบไดนามิก
ข้อดี เข้าใจง่ายขึ้น คุณเพียงต้องพัฒนาและทดสอบโมเดลเพียงครั้งเดียว ปรับเปลี่ยนได้มากขึ้น โมเดลของคุณจะยึดตาม การเปลี่ยนแปลงความสัมพันธ์ระหว่างฟีเจอร์และป้ายกำกับ
ข้อเสีย บางครั้งก็เป็นตัวยง หากความสัมพันธ์ระหว่างคุณลักษณะกับ ป้ายกำกับจะเปลี่ยนแปลงเมื่อเวลาผ่านไป การคาดการณ์ของโมเดลจะลดลง งานมากขึ้น คุณต้องสร้าง ทดสอบ และเผยแพร่ผลิตภัณฑ์ใหม่ ตลอดเวลา

หากชุดข้อมูลไม่มีการเปลี่ยนแปลงเมื่อเวลาผ่านไป ให้เลือกการฝึกแบบคงที่เนื่องจาก การสร้างและบำรุงรักษามีค่าใช้จ่ายที่ถูกกว่าการฝึกแบบไดนามิก อย่างไรก็ตาม ชุดข้อมูล มีแนวโน้มที่จะเปลี่ยนแปลงเมื่อเวลาผ่านไป แม้แต่กับคุณลักษณะที่คุณคิดว่า คงที่อย่างเช่น ระดับน้ำทะเล สิ่งสำคัญที่ได้เรียนรู้: แม้ว่าจะเป็นแบบคงที่ คุณจะยังคงต้องตรวจสอบข้อมูลอินพุตเพื่อดูการเปลี่ยนแปลง

ตัวอย่างเช่น ลองพิจารณาโมเดลที่ได้รับการฝึกให้คาดการณ์ความน่าจะเป็นที่ผู้ใช้ จะซื้อดอกไม้ เนื่องจากแรงกดดันของเวลา โมเดลจึงได้รับการฝึกเพียงครั้งเดียว โดยใช้ชุดข้อมูลพฤติกรรมการซื้อดอกไม้ในช่วงเดือนกรกฎาคมและสิงหาคม โมเดลนี้ทำงานได้ดีเป็นเวลาหลายเดือน แต่หลังจากนั้นก็คาดการณ์ได้อย่างไม่น่าเชื่อ ในช่วงวันวาเลนไทน์เพราะ พฤติกรรมของผู้ใช้ในช่วงวันหยุดดอกไม้นั้นเปลี่ยนแปลงไปอย่างมาก

สำหรับการสำรวจโดยละเอียดเพิ่มเติมของการฝึกแบบคงที่และแบบไดนามิก โปรดดูที่ การจัดการโปรเจ็กต์ ML

แบบฝึกหัด: ตรวจสอบความเข้าใจ

ข้อความ 2 ข้อใดต่อไปนี้เป็นจริงเกี่ยวกับ การฝึกอบรมแบบคงที่ (ออฟไลน์) ได้อย่างไร
รูปแบบจะเป็นปัจจุบันเมื่อมีข้อมูลใหม่
อันที่จริง ถ้าคุณฝึกแบบออฟไลน์ โมเดลจะไม่มีวิธี รวมข้อมูลใหม่ๆ ที่เข้ามาไว้เข้ามาด้วย ซึ่งอาจทําให้เกิดรูปแบบ การหยุดทำงาน หากการเผยแพร่ที่คุณพยายามจะเรียนรู้ การเปลี่ยนแปลงเมื่อเวลาผ่านไป
คุณสามารถยืนยันโมเดลก่อนที่จะนำไปใช้ในเวอร์ชันที่ใช้งานจริง
ใช่ การฝึกแบบออฟไลน์ให้โอกาสอย่างมากในการยืนยันโมเดล ก่อนนำโมเดลไปใช้จริง
การฝึกแบบออฟไลน์ต้องการการตรวจสอบงานการฝึกน้อยกว่า การฝึกอบรมออนไลน์
โดยทั่วไปแล้ว ข้อกำหนดในการตรวจสอบในเวลาฝึกอบรมจะเรียบง่ายกว่า สำหรับการฝึกอบรมแบบออฟไลน์ ซึ่งทำให้คุณ ไม่ต้องเสียเงินจากการผลิต ข้อควรพิจารณา แต่ยิ่งคุณฝึกโมเดลบ่อยเท่าใด คุณก็จะต้องลงทุนในการติดตามดูสูงขึ้นเท่านั้น คุณจะ และตรวจสอบเป็นประจำเพื่อให้แน่ใจว่า การเปลี่ยนแปลงโค้ดของคุณ (และการขึ้นต่อกัน) จะไม่ส่งผลเสียต่อคุณภาพของโมเดล
แทบไม่จำเป็นต้องตรวจสอบข้อมูลอินพุต ในการอนุมาน
คุณไม่จำเป็นต้องตรวจสอบอินพุตขณะแสดงผล หากการกระจายอินพุตเปลี่ยนแปลง โมเดลของเรา การคาดคะเนจึงอาจไม่น่าเชื่อถือ ตัวอย่างเช่น โมเดล ซึ่งได้รับการฝึกด้วย ข้อมูลเสื้อผ้าช่วงฤดูร้อนที่นำไปใช้ได้ทันที คาดการณ์พฤติกรรมการซื้อเสื้อผ้าในช่วงฤดูหนาว
ข้อความใดข้อความหนึ่งต่อไปนี้เป็นจริง ฝึกอบรมแบบไดนามิก (ออนไลน์) ได้อย่างไร
รูปแบบจะเป็นปัจจุบันเมื่อมีข้อมูลใหม่
ซึ่งเป็นประโยชน์หลักของการฝึกอบรมออนไลน์ คุณสามารถหลีกเลี่ยง ปัญหาการไม่มีอัปเดต โดยอนุญาตให้โมเดลฝึกกับข้อมูลใหม่ ส่งตรงเข้ามา
ไม่จำเป็นต้องติดตามงานการฝึกมากนัก
ที่จริงแล้ว คุณต้องตรวจสอบงานการฝึกอย่างต่อเนื่องเพื่อให้แน่ใจว่า สัตว์จะมีสุขภาพดีและทำงานได้ตามที่ตั้งใจไว้ นอกจากนี้ คุณยังต้อง โครงสร้างพื้นฐานสนับสนุน เช่น ความสามารถในการย้อนกลับโมเดล ไปยังสแนปชอตก่อนหน้านี้ เผื่อเกิดข้อผิดพลาดในการฝึก เช่น เกิดข้อบกพร่องหรือความเสียหายของข้อมูลอินพุต
แทบไม่จำเป็นต้องตรวจสอบข้อมูลอินพุต ในการอนุมาน
เช่นเดียวกับโมเดลแบบคงที่แบบออฟไลน์ สิ่งสำคัญคือต้อง ตรวจสอบอินพุตสำหรับโมเดลที่อัปเดตแบบไดนามิก คุณ น่าจะไม่ต้องเสี่ยงต่อผลกระทบตามฤดูกาล ขนาดใหญ่ แต่ก็เกิดขึ้นกะทันหัน มีการเปลี่ยนแปลงข้อมูลอย่างมากกับอินพุต (เช่น แหล่งข้อมูลอัปสตรีมที่กำลังดำเนินการ ลดลง) ก็อาจทำให้การคาดคะเนไม่น่าเชื่อถือได้