โปรเจ็กต์ ML ต้องมีสมาชิกที่มีทักษะ ความเชี่ยวชาญ และความรับผิดชอบเกี่ยวกับแมชชีนเลิร์นนิง ต่อไปนี้คือบทบาทที่พบบ่อยที่สุดในทีม ML ทั่วไป
บทบาท | ความรู้และทักษะ | ผลงานหลัก |
---|---|---|
ผู้จัดการผลิตภัณฑ์ ML | ผู้จัดการผลิตภัณฑ์ ML มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับจุดแข็งและ จุดอ่อนและกระบวนการพัฒนา ML ปรับโจทย์ทางธุรกิจให้สอดคล้องกัน ไปจนถึงโซลูชัน ML ด้วยการทำงานร่วมกับทีม ML, ผู้ใช้ปลายทาง และผู้มีส่วนเกี่ยวข้องคนอื่นๆ โดยมีหน้าที่สร้างวิสัยทัศน์ของผลิตภัณฑ์ กำหนดกรณีการใช้งานและข้อกำหนด รวมถึงวางแผนและจัดลำดับความสำคัญของโปรเจ็กต์ |
เอกสารข้อกำหนดสำหรับผลิตภัณฑ์ (PRD) |
ผู้จัดการฝ่ายวิศวกรรม | ผู้จัดการฝ่ายวิศวกรรมบรรลุเป้าหมายทางธุรกิจโดยการกำหนด การสื่อสาร และ บรรลุลำดับความสำคัญของทีมได้เป็นอย่างดี เช่นเดียวกับผู้จัดการผลิตภัณฑ์ ML ผู้เชี่ยวชาญเหล่านี้จะปรับโซลูชัน ML ให้เข้ากับปัญหาทางธุรกิจ โดยกำหนดความคาดหวังที่ชัดเจนสำหรับสมาชิกในทีม ดำเนินการประเมินประสิทธิภาพ และช่วยพัฒนาอาชีพและวิชาชีพ |
ออกแบบเอกสาร แผนโครงการ และการประเมินประสิทธิภาพ |
นักวิทยาศาสตร์ข้อมูล | นักวิทยาศาสตร์ข้อมูลใช้การวิเคราะห์เชิงปริมาณและสถิติเพื่อดึงข้อมูลเชิงลึกและมูลค่าจากข้อมูล ซึ่งช่วยระบุและทดสอบฟีเจอร์ โมเดลต้นแบบ และช่วยในการตีความโมเดล | รายงานและการแสดงข้อมูลผ่านภาพซึ่งตอบคำถามเกี่ยวกับธุรกิจ ผ่านการวิเคราะห์เชิงสถิติ |
วิศวกร ML | วิศวกร ML ออกแบบ สร้าง ผลิต และจัดการโมเดล ML เป็นวิศวกรซอฟต์แวร์ที่แข็งแกร่งและเข้าใจ ML อย่างลึกซึ้ง เทคโนโลยีและแนวทางปฏิบัติที่ดีที่สุด | ติดตั้งใช้งานโมเดลที่มีคุณภาพการคาดการณ์เพียงพอที่จะรองรับธุรกิจแล้ว เป้าหมาย |
วิศวกรข้อมูล | วิศวกรข้อมูลสร้างไปป์ไลน์ข้อมูลสำหรับจัดเก็บ รวบรวม และ การประมวลผลข้อมูลจำนวนมาก โดยทีมจะพัฒนาโครงสร้างพื้นฐานและระบบสําหรับรวบรวมและเปลี่ยนรูปแบบข้อมูลดิบให้เป็นรูปแบบที่มีประโยชน์สําหรับการฝึกและแสดงโมเดล วิศวกรข้อมูลคือ รับผิดชอบต่อข้อมูลตลอดกระบวนการพัฒนา ML | Data Pipeline เวอร์ชันที่ใช้งานจริงโดยสมบูรณ์ซึ่งมีการตรวจสอบที่จำเป็นและ การแจ้งเตือน |
วิศวกรฝ่ายปฏิบัติการสำหรับนักพัฒนาซอฟต์แวร์ (DevOps) | วิศวกร DevOps พัฒนา ติดตั้งใช้งาน ปรับขนาด และตรวจสอบ โครงสร้างพื้นฐานการให้บริการสำหรับโมเดล ML | กระบวนการอัตโนมัติในการแสดงผล การตรวจสอบ การทดสอบ และการแจ้งเตือนเกี่ยวกับลักษณะการทํางานของโมเดล |
โปรเจ็กต์ ML ที่ประสบความสำเร็จต้องมีทีมที่แต่ละบทบาทดี ที่มีตัวแทน ในทีมขนาดเล็ก แต่ละคนจะต้องจัดการ มีหน้าที่รับผิดชอบในหลายบทบาท
สร้างแนวทางปฏิบัติของทีม
เนื่องจากบทบาท เครื่องมือ และเฟรมเวิร์กใน ML มีความแตกต่างกันอย่างมาก คุณจำเป็นต้องสร้างแนวทางปฏิบัติทั่วไปผ่าน เกี่ยวกับกระบวนการทำงานที่ยอดเยี่ยม เช่น วิศวกรคนหนึ่งอาจ ให้คิดว่าการรับข้อมูลที่ถูกต้อง ก็เพียงพอแล้วที่จะเริ่มต้นฝึกโมเดล ในขณะที่วิศวกรที่รับผิดชอบมากกว่าจะตรวจสอบว่าชุดข้อมูลนั้นมีการลบข้อมูลระบุตัวบุคคล รวมถึงบันทึกข้อมูลเมตาและแหล่งที่มาของไฟล์อย่างถูกต้อง ตรวจสอบให้แน่ใจว่าวิศวกรเปิดเผยข้อมูล คำจำกัดความทั่วไปของกระบวนการและรูปแบบการออกแบบช่วยลดความสับสนและ ช่วยให้ทีมทำงานได้เร็วขึ้น
เอกสารประกอบกระบวนการ
เอกสารกระบวนการควรระบุเครื่องมือ โครงสร้างพื้นฐาน และกระบวนการที่ทีมจะใช้ในการพัฒนา ML เอกสารกระบวนการที่ดีจะช่วยให้สมาชิกใหม่และสมาชิกปัจจุบันของทีมทำงานร่วมกันได้ โดยตอบคำถามประเภทต่อไปนี้
- ระบบสร้างข้อมูลสำหรับโมเดลนี้อย่างไร
- เราจะตรวจสอบ ตรวจสอบ และแสดงข้อมูลออกมาเป็นภาพได้อย่างไร
- เราจะแก้ไขฟีเจอร์อินพุตหรือป้ายกำกับในข้อมูลการฝึกได้อย่างไร
- เราจะปรับแต่งไปป์ไลน์การสร้าง การฝึก และการประเมินข้อมูลอย่างไร
- ฉันจะเปลี่ยนสถาปัตยกรรมโมเดลเพื่อรองรับการเปลี่ยนแปลงในอินพุตได้อย่างไร ฟีเจอร์หรือป้ายกำกับ
- เราจะขอตัวอย่างการทดสอบได้อย่างไร
- เราจะใช้เมตริกใดในการตัดสินคุณภาพของโมเดล
- เราจะเปิดตัวโมเดลในเวอร์ชันที่ใช้งานจริงได้อย่างไร
- เราจะทราบได้อย่างไรว่าโมเดลทำงานผิดปกติ
- โมเดลของเราใช้ระบบอัปสตรีมแบบใด
- ฉันจะทำให้ SQL มีการบำรุงรักษาได้และนํากลับมาใช้ซ้ำได้อย่างไร
คำถามเพิ่มเติมที่อาจเกิดขึ้น
โมเดลฉันจะฝึกโมเดลในชุดข้อมูลที่แตกต่างกันในไปป์ไลน์เดียวกันได้ไหม เช่น สำหรับการปรับแต่งแบบละเอียด
ฉันจะเพิ่มชุดข้อมูลทดสอบใหม่ลงในไปป์ไลน์ได้อย่างไร
ฉันจะตรวจสอบการคาดคะเนของโมเดลในตัวอย่างแบบทำมือได้อย่างไร
ฉันจะค้นหา ตรวจสอบ และแสดงตัวอย่างที่โมเดลทำผิดพลาดได้อย่างไร
ฉันจะทราบได้อย่างไรว่าฟีเจอร์ใดมีหน้าที่รับผิดชอบมากที่สุดสำหรับ การคาดการณ์
ฉันจะทราบได้อย่างไรว่าฟีเจอร์ใดส่งผลต่อการทำนายมากที่สุดในตัวอย่างที่กำหนด
ฉันจะคํานวณหรือพล็อตการคาดการณ์ของโมเดลในชุดข้อมูลหรือตัวอย่างที่เลือกได้อย่างไร
ฉันจะคํานวณเมตริกมาตรฐานสําหรับการคาดการณ์ของโมเดลในชุดข้อมูลที่เลือกได้อย่างไร
ฉันจะพัฒนาและคำนวณเมตริกที่กำหนดเองได้อย่างไร
ฉันจะเปรียบเทียบรูปแบบของฉันกับรูปแบบอื่นๆ ออฟไลน์ได้อย่างไร
ฉันทำการเมตาวิเคราะห์การประเมินโมเดลหลายรายการในสภาพแวดล้อมการพัฒนาเดียวได้ไหม
ฉันเปรียบเทียบโมเดลปัจจุบันกับรูปแบบเมื่อ 10 เดือนที่แล้วได้ไหม
ฉันคิดว่าฉันสร้างโมเดลที่ดีแล้ว ฉันจะเปิดตัวเวอร์ชันที่ใช้งานจริงได้อย่างไร
ฉันจะตรวจสอบได้อย่างไรว่าโมเดลใหม่ของฉันทำงานได้อย่างถูกต้องในเวอร์ชันที่ใช้งานจริง
ฉันจะรับประวัติของการประเมินโมเดลเมื่อเวลาผ่านไปได้ไหม
ฉันจะทราบได้อย่างไรเมื่อโมเดลทำงานผิดปกติ
ฉันได้รับหน้า/ข้อบกพร่องที่ระบุบางอย่างเกี่ยวกับโมเดล ฉันควรทำอย่างไร
ฉันจะปรับแต่งการสร้าง/การฝึก/การประเมินข้อมูลได้อย่างไร ไปป์ไลน์
ฉันควรสร้างไปป์ไลน์ใหม่ทั้งหมดเมื่อใดและอย่างไร
ฉันต้องการ SQL เพื่อสร้างข้อมูลบางอย่าง ฉันควรวางไว้ที่ใด
การแสดงโมเดลของเราทํางานอย่างไร มีแผนภาพไหม
ฉันควรทราบอะไรบ้างเกี่ยวกับระบบต้นทางที่โมเดลของฉันใช้
ไม่รู้อะไรเลย ฉันควรติดต่อใคร (และอย่างไร)
โปรดทราบ
"แนวทางปฏิบัติแนะนำสําหรับ ML" อาจแตกต่างกันไปในแต่ละบริษัท ทีม และบุคคล สำหรับ เช่น สมาชิกทีมบางคนอาจพิจารณาใช้ Colab เวอร์ชันทดลองเป็น ในขณะที่คนอื่นๆ ต้องการทำงานใน R บางคนอาจหลงใหลในวิศวกรรมซอฟต์แวร์ บางคนคิดว่าการตรวจสอบเป็นสิ่งสําคัญที่สุด แต่บางคนก็ทราบแนวทางปฏิบัติที่ดีในการใช้งานฟีเจอร์ในเวอร์ชันที่ใช้งานจริง แต่ต้องการใช้ Scala ทุกคนมี "สิทธิ์" ในมุมมองของตนเอง และหากจัดการอย่างถูกต้อง การผสมผสานดังกล่าวจะกลายเป็นพลังขับเคลื่อน มิเช่นนั้นอาจทำให้เกิดความสับสน
กำหนดเครื่องมือ กระบวนการ และโครงสร้างพื้นฐานที่ทีมจะใช้ก่อน การเขียนบรรทัดรหัสอาจเป็นความแตกต่างระหว่าง โครงการที่ล้มเหลวหลังจาก 2 ปีหรือประสบความสำเร็จในการเปิดตัว 1 ไตรมาสก่อนกำหนด
การประเมินประสิทธิภาพ
เนื่องจาก ML มีความคลุมเครือและไม่แน่นอน ผู้จัดการฝ่ายบุคคลจึงต้องกำหนดความคาดหวังที่ชัดเจนและระบุสิ่งที่ต้องส่งตั้งแต่เนิ่นๆ
เมื่อกําหนดความคาดหวังและสิ่งที่นําส่ง ให้พิจารณาว่าจะมีการประเมินอย่างไรหากโปรเจ็กต์หรือแนวทางไม่ประสบความสําเร็จ กล่าวคือ คือประสิทธิภาพของสมาชิกในทีมไม่ได้เกี่ยวข้องกับ ของโครงการ เช่น การที่สมาชิกในทีมใช้จ่าย หลายสัปดาห์ในการตรวจสอบวิธีแก้ปัญหาที่ท้ายที่สุดแล้ว แม้แต่ในกรณีเหล่านี้ โค้ดคุณภาพสูง เอกสารประกอบที่ละเอียด และการประสานงานที่มีประสิทธิภาพก็ควรส่งผลเชิงบวกต่อการประเมิน