การก่อตั้งทีม ML

โปรเจ็กต์ ML ต้องมีสมาชิกที่มีทักษะ ความเชี่ยวชาญ และความรับผิดชอบเกี่ยวกับแมชชีนเลิร์นนิง ต่อไปนี้คือบทบาทที่พบบ่อยที่สุดในทีม ML ทั่วไป

บทบาท ความรู้และทักษะ ผลงานหลัก
ผู้จัดการผลิตภัณฑ์ ML ผู้จัดการผลิตภัณฑ์ ML มีความเข้าใจอย่างลึกซึ้งเกี่ยวกับจุดแข็งและ จุดอ่อนและกระบวนการพัฒนา ML ปรับโจทย์ทางธุรกิจให้สอดคล้องกัน ไปจนถึงโซลูชัน ML ด้วยการทำงานร่วมกับทีม ML, ผู้ใช้ปลายทาง และผู้มีส่วนเกี่ยวข้องคนอื่นๆ โดยมีหน้าที่สร้างวิสัยทัศน์ของผลิตภัณฑ์ กำหนดกรณีการใช้งานและข้อกำหนด รวมถึงวางแผนและจัดลำดับความสำคัญของโปรเจ็กต์ เอกสารข้อกำหนดสำหรับผลิตภัณฑ์ (PRD)
ผู้จัดการฝ่ายวิศวกรรม ผู้จัดการฝ่ายวิศวกรรมบรรลุเป้าหมายทางธุรกิจโดยการกำหนด การสื่อสาร และ บรรลุลำดับความสำคัญของทีมได้เป็นอย่างดี เช่นเดียวกับผู้จัดการผลิตภัณฑ์ ML ผู้เชี่ยวชาญเหล่านี้จะปรับโซลูชัน ML ให้เข้ากับปัญหาทางธุรกิจ โดยกำหนดความคาดหวังที่ชัดเจนสำหรับสมาชิกในทีม ดำเนินการประเมินประสิทธิภาพ และช่วยพัฒนาอาชีพและวิชาชีพ ออกแบบเอกสาร แผนโครงการ และการประเมินประสิทธิภาพ
นักวิทยาศาสตร์ข้อมูล นักวิทยาศาสตร์ข้อมูลใช้การวิเคราะห์เชิงปริมาณและสถิติเพื่อดึงข้อมูลเชิงลึกและมูลค่าจากข้อมูล ซึ่งช่วยระบุและทดสอบฟีเจอร์ โมเดลต้นแบบ และช่วยในการตีความโมเดล รายงานและการแสดงข้อมูลผ่านภาพซึ่งตอบคำถามเกี่ยวกับธุรกิจ ผ่านการวิเคราะห์เชิงสถิติ
วิศวกร ML วิศวกร ML ออกแบบ สร้าง ผลิต และจัดการโมเดล ML เป็นวิศวกรซอฟต์แวร์ที่แข็งแกร่งและเข้าใจ ML อย่างลึกซึ้ง เทคโนโลยีและแนวทางปฏิบัติที่ดีที่สุด ติดตั้งใช้งานโมเดลที่มีคุณภาพการคาดการณ์เพียงพอที่จะรองรับธุรกิจแล้ว เป้าหมาย
วิศวกรข้อมูล วิศวกรข้อมูลสร้างไปป์ไลน์ข้อมูลสำหรับจัดเก็บ รวบรวม และ การประมวลผลข้อมูลจำนวนมาก โดยทีมจะพัฒนาโครงสร้างพื้นฐานและระบบสําหรับรวบรวมและเปลี่ยนรูปแบบข้อมูลดิบให้เป็นรูปแบบที่มีประโยชน์สําหรับการฝึกและแสดงโมเดล วิศวกรข้อมูลคือ รับผิดชอบต่อข้อมูลตลอดกระบวนการพัฒนา ML Data Pipeline เวอร์ชันที่ใช้งานจริงโดยสมบูรณ์ซึ่งมีการตรวจสอบที่จำเป็นและ การแจ้งเตือน
วิศวกรฝ่ายปฏิบัติการสำหรับนักพัฒนาซอฟต์แวร์ (DevOps) วิศวกร DevOps พัฒนา ติดตั้งใช้งาน ปรับขนาด และตรวจสอบ โครงสร้างพื้นฐานการให้บริการสำหรับโมเดล ML กระบวนการอัตโนมัติในการแสดงผล การตรวจสอบ การทดสอบ และการแจ้งเตือนเกี่ยวกับลักษณะการทํางานของโมเดล

โปรเจ็กต์ ML ที่ประสบความสำเร็จต้องมีทีมที่แต่ละบทบาทดี ที่มีตัวแทน ในทีมขนาดเล็ก แต่ละคนจะต้องจัดการ มีหน้าที่รับผิดชอบในหลายบทบาท

สร้างแนวทางปฏิบัติของทีม

เนื่องจากบทบาท เครื่องมือ และเฟรมเวิร์กใน ML มีความแตกต่างกันอย่างมาก คุณจำเป็นต้องสร้างแนวทางปฏิบัติทั่วไปผ่าน เกี่ยวกับกระบวนการทำงานที่ยอดเยี่ยม เช่น วิศวกรคนหนึ่งอาจ ให้คิดว่าการรับข้อมูลที่ถูกต้อง ก็เพียงพอแล้วที่จะเริ่มต้นฝึกโมเดล ในขณะที่วิศวกรที่รับผิดชอบมากกว่าจะตรวจสอบว่าชุดข้อมูลนั้นมีการลบข้อมูลระบุตัวบุคคล รวมถึงบันทึกข้อมูลเมตาและแหล่งที่มาของไฟล์อย่างถูกต้อง ตรวจสอบให้แน่ใจว่าวิศวกรเปิดเผยข้อมูล คำจำกัดความทั่วไปของกระบวนการและรูปแบบการออกแบบช่วยลดความสับสนและ ช่วยให้ทีมทำงานได้เร็วขึ้น

เอกสารประกอบกระบวนการ

เอกสารกระบวนการควรระบุเครื่องมือ โครงสร้างพื้นฐาน และกระบวนการที่ทีมจะใช้ในการพัฒนา ML เอกสารกระบวนการที่ดีจะช่วยให้สมาชิกใหม่และสมาชิกปัจจุบันของทีมทำงานร่วมกันได้ โดยตอบคำถามประเภทต่อไปนี้

  • ระบบสร้างข้อมูลสำหรับโมเดลนี้อย่างไร
  • เราจะตรวจสอบ ตรวจสอบ และแสดงข้อมูลออกมาเป็นภาพได้อย่างไร
  • เราจะแก้ไขฟีเจอร์อินพุตหรือป้ายกำกับในข้อมูลการฝึกได้อย่างไร
  • เราจะปรับแต่งไปป์ไลน์การสร้าง การฝึก และการประเมินข้อมูลอย่างไร
  • ฉันจะเปลี่ยนสถาปัตยกรรมโมเดลเพื่อรองรับการเปลี่ยนแปลงในอินพุตได้อย่างไร ฟีเจอร์หรือป้ายกำกับ
  • เราจะขอตัวอย่างการทดสอบได้อย่างไร
  • เราจะใช้เมตริกใดในการตัดสินคุณภาพของโมเดล
  • เราจะเปิดตัวโมเดลในเวอร์ชันที่ใช้งานจริงได้อย่างไร
  • เราจะทราบได้อย่างไรว่าโมเดลทำงานผิดปกติ
  • โมเดลของเราใช้ระบบอัปสตรีมแบบใด
  • ฉันจะทำให้ SQL มีการบำรุงรักษาได้และนํากลับมาใช้ซ้ำได้อย่างไร

คำถามเพิ่มเติมที่อาจเกิดขึ้น

โมเดล
  • ฉันจะฝึกโมเดลในชุดข้อมูลที่แตกต่างกันในไปป์ไลน์เดียวกันได้ไหม เช่น สำหรับการปรับแต่งแบบละเอียด

  • ฉันจะเพิ่มชุดข้อมูลทดสอบใหม่ลงในไปป์ไลน์ได้อย่างไร

การฝึกอบรม
  • ฉันจะตรวจสอบการคาดคะเนของโมเดลในตัวอย่างแบบทำมือได้อย่างไร

  • ฉันจะค้นหา ตรวจสอบ และแสดงตัวอย่างที่โมเดลทำผิดพลาดได้อย่างไร

  • ฉันจะทราบได้อย่างไรว่าฟีเจอร์ใดมีหน้าที่รับผิดชอบมากที่สุดสำหรับ การคาดการณ์

  • ฉันจะทราบได้อย่างไรว่าฟีเจอร์ใดส่งผลต่อการทำนายมากที่สุดในตัวอย่างที่กำหนด

  • ฉันจะคํานวณหรือพล็อตการคาดการณ์ของโมเดลในชุดข้อมูลหรือตัวอย่างที่เลือกได้อย่างไร

  • ฉันจะคํานวณเมตริกมาตรฐานสําหรับการคาดการณ์ของโมเดลในชุดข้อมูลที่เลือกได้อย่างไร

  • ฉันจะพัฒนาและคำนวณเมตริกที่กำหนดเองได้อย่างไร

  • ฉันจะเปรียบเทียบรูปแบบของฉันกับรูปแบบอื่นๆ ออฟไลน์ได้อย่างไร

  • ฉันทำการเมตาวิเคราะห์การประเมินโมเดลหลายรายการในสภาพแวดล้อมการพัฒนาเดียวได้ไหม

  • ฉันเปรียบเทียบโมเดลปัจจุบันกับรูปแบบเมื่อ 10 เดือนที่แล้วได้ไหม

การผลิตวิดีโอ การตรวจสอบ และการบำรุงรักษา
  • ฉันคิดว่าฉันสร้างโมเดลที่ดีแล้ว ฉันจะเปิดตัวเวอร์ชันที่ใช้งานจริงได้อย่างไร

  • ฉันจะตรวจสอบได้อย่างไรว่าโมเดลใหม่ของฉันทำงานได้อย่างถูกต้องในเวอร์ชันที่ใช้งานจริง

  • ฉันจะรับประวัติของการประเมินโมเดลเมื่อเวลาผ่านไปได้ไหม

  • ฉันจะทราบได้อย่างไรเมื่อโมเดลทำงานผิดปกติ

  • ฉันได้รับหน้า/ข้อบกพร่องที่ระบุบางอย่างเกี่ยวกับโมเดล ฉันควรทำอย่างไร

ไปป์ไลน์
  • ฉันจะปรับแต่งการสร้าง/การฝึก/การประเมินข้อมูลได้อย่างไร ไปป์ไลน์

  • ฉันควรสร้างไปป์ไลน์ใหม่ทั้งหมดเมื่อใดและอย่างไร

SQL
  • ฉันต้องการ SQL เพื่อสร้างข้อมูลบางอย่าง ฉันควรวางไว้ที่ใด

โครงสร้างพื้นฐาน
  • การแสดงโมเดลของเราทํางานอย่างไร มีแผนภาพไหม

  • ฉันควรทราบอะไรบ้างเกี่ยวกับระบบต้นทางที่โมเดลของฉันใช้

การสื่อสาร
  • ไม่รู้อะไรเลย ฉันควรติดต่อใคร (และอย่างไร)

โปรดทราบ

"แนวทางปฏิบัติแนะนำสําหรับ ML" อาจแตกต่างกันไปในแต่ละบริษัท ทีม และบุคคล สำหรับ เช่น สมาชิกทีมบางคนอาจพิจารณาใช้ Colab เวอร์ชันทดลองเป็น ในขณะที่คนอื่นๆ ต้องการทำงานใน R บางคนอาจหลงใหลในวิศวกรรมซอฟต์แวร์ บางคนคิดว่าการตรวจสอบเป็นสิ่งสําคัญที่สุด แต่บางคนก็ทราบแนวทางปฏิบัติที่ดีในการใช้งานฟีเจอร์ในเวอร์ชันที่ใช้งานจริง แต่ต้องการใช้ Scala ทุกคนมี "สิทธิ์" ในมุมมองของตนเอง และหากจัดการอย่างถูกต้อง การผสมผสานดังกล่าวจะกลายเป็นพลังขับเคลื่อน มิเช่นนั้นอาจทำให้เกิดความสับสน

กำหนดเครื่องมือ กระบวนการ และโครงสร้างพื้นฐานที่ทีมจะใช้ก่อน การเขียนบรรทัดรหัสอาจเป็นความแตกต่างระหว่าง โครงการที่ล้มเหลวหลังจาก 2 ปีหรือประสบความสำเร็จในการเปิดตัว 1 ไตรมาสก่อนกำหนด

การประเมินประสิทธิภาพ

เนื่องจาก ML มีความคลุมเครือและไม่แน่นอน ผู้จัดการฝ่ายบุคคลจึงต้องกำหนดความคาดหวังที่ชัดเจนและระบุสิ่งที่ต้องส่งตั้งแต่เนิ่นๆ

เมื่อกําหนดความคาดหวังและสิ่งที่นําส่ง ให้พิจารณาว่าจะมีการประเมินอย่างไรหากโปรเจ็กต์หรือแนวทางไม่ประสบความสําเร็จ กล่าวคือ คือประสิทธิภาพของสมาชิกในทีมไม่ได้เกี่ยวข้องกับ ของโครงการ เช่น การที่สมาชิกในทีมใช้จ่าย หลายสัปดาห์ในการตรวจสอบวิธีแก้ปัญหาที่ท้ายที่สุดแล้ว แม้แต่ในกรณีเหล่านี้ โค้ดคุณภาพสูง เอกสารประกอบที่ละเอียด และการประสานงานที่มีประสิทธิภาพก็ควรส่งผลเชิงบวกต่อการประเมิน

ทดสอบความเข้าใจ

สาเหตุหลักของการมีเอกสารประกอบเกี่ยวกับกระบวนการที่ยอดเยี่ยมคืออะไร และกำหนดแนวทางปฏิบัติทั่วไป
เพิ่มความเร็วของโปรเจ็กต์
ถูกต้อง การมีเอกสารประกอบกระบวนการที่ดีและการกำหนดแนวทางปฏิบัติทั่วไปช่วยลดความสับสนและปรับปรุงกระบวนการพัฒนาให้มีประสิทธิภาพยิ่งขึ้น
สร้างแนวทางปฏิบัติแนะนำสำหรับทั้งบริษัท
เนื่องจากการพัฒนา ML นั้นแตกต่างกันไปในแต่ละโปรเจ็กต์ ทีมต่างๆ จึงมักจะสร้างชุดแนวทางปฏิบัติแนะนำของตนเองเพื่อให้ทำงานได้อย่างมีประสิทธิภาพและเพิ่มความเร็วในการทำงาน
ตรวจสอบว่าวิศวกรทุกคนในทีมมีความเชี่ยวชาญในระดับเดียวกัน
โดยทั่วไปแล้ว ทีม ML จะมีวิศวกรที่มีทักษะและความรู้หลากหลาย การจัดทำเอกสารประกอบเกี่ยวกับกระบวนการช่วยให้วิศวกรนำแนวทางปฏิบัติแนะนำไปปรับใช้ได้ เพื่อเพิ่มความเร็ว