تجميع فريق التعلم الآلي

تتطلّب مشاريع تعلُّم الآلة فرقًا تتضمّن أعضاء لديهم مجموعة من المهارات والخبرات والمسؤوليات المتعلّقة بتعلُّم الآلة. في ما يلي عناوين الوظائف الأكثر شيوعًا في فِرق الذكاء الاصطناعي النموذجية:

الدور المعرفة والمهارات المنتج الرئيسي
مدير منتجات الذكاء الاصطناعي يمتلك مدراء منتجات الذكاء الاصطناعي فهمًا عميقًا لنقاط القوة والضعف في الذكاء الاصطناعي وعملية تطويره. وينسّقون بين مشاكل النشاط التجاري وحلول تعلُّم الآلة من خلال العمل مباشرةً مع فريق تعلُّم الآلة والمستخدمين النهائيين والمعنيّين الآخرين. وهم ينشئون رؤية المنتج ويحدّدون حالات الاستخدام والمتطلبات ويخطّطون للمشاريع ويحدّدون أولوياتها. وثيقة متطلبات المنتج (PRD)
مدير الهندسة يحقّق مدراء الهندسة أهداف النشاط التجاري من خلال تحديد أولويات الفريق ومناقشتها و تحقيقها. مثل مديري منتجات تعلُّم الآلة، ينسِّبون حلول تعلُّم الآلة إلى مشاكل النشاط التجاري. ويحدّدون توقعات واضحة لأعضاء الفريق، ويُجريون تقييمات الأداء، ويساعدون في تطوير المسار الوظيفي والنمو المهني. مستندات التصميم وخطط المشاريع وتقييمات الأداء
عالِم بيانات يستخدم علماء البيانات التحليل الكمي والإحصائي لاستخراج الإحصاءات والقيمة من البيانات. وتساعد هذه الميزات في تحديد واختبار الميزات والنماذج النموذجية، كما تساعد في تفسير النماذج. التقارير وعروض البيانات المرئية التي تجيب عن أسئلة الأعمال من خلال التحليل الإحصائي
مهندس تعلُّم آلي يعمل مهندسو تعلُّم الآلة على تصميم نماذج تعلُّم الآلة وإنشائها ونشرها وإدارتها. وهم مهندسو برمجيات بارعون لديهم فهم عميق لتقنيات تعلُّم الآلة وأفضل الممارسات. نموذج تم نشره بجودة توقّعات كافية لتحقيق أهداف النشاط التجاري
مهندس بيانات ينشئ مهندسو البيانات قنوات بيانات لتخزين كميات كبيرة من البيانات وجمعها ومعالجتها. وهم يطوّرون البنية الأساسية و الأنظمة لجمع البيانات الأولية وتحويلها إلى تنسيقات مفيدة لتدريب النماذج وعرضها. يتحمّل مهندسو البيانات المسؤولية عن البيانات في جميع مراحل تطوير تعلُّم الآلة. مسارات بيانات مُعدّة للاستخدام في مرحلة الإنتاج بالكامل مع عمليات المراقبة والتحذير اللازمة
مهندس عمليات المطوّرين (DevOps) يطوّر مهندسو DevOps البنية الأساسية لعرض نماذج تعلُّم الآلة وينشرونها ويوسّعون نطاقها ويراقبونها. عملية مبرمَجة لعرض سلوك النموذج ومراقبته واختباره والتنبيه بشأنه

تتضمّن مشاريع الذكاء الاصطناعي الناجحة فِرقًا تم فيها إشراك كل دور بشكلٍ جيد. في الفرق الأصغر، سيحتاج الأفراد إلى التعامل مع مسؤوليات أدوار متعددة.

وضع ممارسات الفريق

ولأنّ الأدوار والأدوات والأُطر تختلف اختلافًا كبيرًا في تطوير الذكاء الاصطناعي، من المهم وضع الممارسات الشائعة من خلال مستندات عملية ممتازة. على سبيل المثال، قد يعتقد أحد المهندسين أنّ الحصول على البيانات الصحيحة فقط كافٍ لبدء تدريب نموذج، في حين أنّ مهندسًا أكثر مسؤولية سيتحقّق من إخفاء هوية مجموعة البيانات بشكل صحيح ويوثّق بياناتها الوصفية ومصدرها. إنّ التأكّد من مشاركة المهندسين للتعريفات الشائعة للعمليات وأنماط التصميم يقلل من الالتباس ويؤدي إلى زيادة سرعة عمل الفريق.

مستندات العملية

يجب أن تحدِّد مستندات العملية الأدوات والبنية الأساسية والعمليات التي سيستخدمها الفريق لتطوير الذكاء الاصطناعي. تساعد مستندات العمليات الجيدة في مواءمة أعضاء الفريق الحاليين والجدد. يجب أن تجيب عن أنواع الأسئلة التالية:

  • كيف يتم إنشاء البيانات للنموذج؟
  • كيف نفحص البيانات ونتحقق من صحتها ونعرضها؟
  • كيف يمكننا تعديل سمة إدخال أو تصنيف في بيانات التدريب؟
  • كيف يمكننا تخصيص مسار إنشاء البيانات والتدريب والتقييم؟
  • كيف يمكنني تغيير بنية النموذج لاستيعاب التغييرات في سمات أو تصنيفات الإدخال؟
  • كيف نحصل على أمثلة الاختبار؟
  • ما هي المقاييس التي سنستخدمها لتقييم جودة النموذج؟
  • كيف نطلق نماذجنا في مرحلة الإنتاج؟
  • كيف سنعرف ما إذا كان هناك خطأ في النموذج؟
  • ما هي الأنظمة الأساسية التي تعتمد عليها نماذجنا؟
  • كيف يمكنني جعل طلبات البحث في SQL قابلة للصيانة وإعادة الاستخدام؟
النموذج
  • هل يمكنني تدريب النماذج على مجموعات بيانات مختلفة في مسار المعالجة نفسه، مثل التحسين؟

  • كيف يمكنني إضافة مجموعة بيانات اختبار جديدة إلى مسار الإحالة الناجحة؟

التدريب
  • كيف يمكنني التحقّق من توقّعات النموذج على مثال تم إنشاؤه يدويًا؟

  • كيف يمكنني العثور على الأمثلة التي ارتكب فيها النموذج أخطاءً وفحصها وعرضها بشكل مرئي؟

  • كيف يمكنني تحديد الميزة الأكثر مسؤولية عن توقّع معيّن؟

  • كيف يمكنني معرفة الميزات التي لها أكبر تأثير في التوقّعات ضمن عيّنة معيّنة؟

  • كيف يمكنني احتساب توقّعات النموذج أو رسمها على مجموعة بيانات أو عيّنة محدّدة؟

  • كيف يمكنني احتساب المقاييس العادية لتوقّعات النموذج على مجموعة بيانات محدّدة؟

  • كيف يمكنني تطوير المقاييس المخصّصة واحتساب قيمها؟

  • كيف يمكنني مقارنة نموذجي بالنماذج الأخرى بلا إنترنت؟

  • هل يمكنني إجراء تحليل تراكمي لتقييمات نماذج متعددة في بيئة تطوير واحدة؟

  • هل يمكنني مقارنة النموذج الحالي بالنموذج الذي يعود إلى 10 أشهر؟

النشر والمراقبة والصيانة
  • أعتقد أنّني أنشأت نموذجًا جيدًا. كيف يمكنني إطلاقه في قناة الإصدار العلني؟

  • كيف يمكنني التأكّد من أنّ النموذج الجديد يعمل بشكلٍ صحيح في مرحلة الإنتاج؟

  • هل يمكنني الحصول على سجلّ تقييمات النماذج بمرور الوقت؟

  • كيف سأعرف متى يكون هناك خطأ في النموذج؟

  • تمّ إسناد صفحة/خطأ إليّ يشير إلى شيء عن النموذج. ماذا يجب أن أفعل؟

الخطوط المائية
  • كيف يمكنني تخصيص مسار إنشاء/تدريب/تقييم البيانات؟

  • متى يجب إنشاء مسار جديد تمامًا وكيفية إنشاءه؟

SQL
  • أحتاج إلى SQL لإنشاء بعض البيانات. أين يجب أن أضع الرمز؟

البنية الأساسية
  • كيف يعمل عرض النماذج؟ هل هناك رسم بياني؟

  • ما هي الأنظمة الأساسية التي يعتمد عليها نموذجي والتي يجب أن أكون على دراية بها؟

التواصل
  • لا يمكنني معرفة السبب. ما هي الجهة التي يمكنني التواصل معها (وكيف)؟

تنبيه

يمكن أن تختلف "أفضل الممارسات المتعلّقة بالذكاء الاصطناعي" بين الشركات والفِرق والأفراد. على سبيل المثال، قد يعتبر بعض أعضاء الفريق "مشاريع تعاونية" التجريبية كمنتج التسليم الرئيسي، بينما يريد البعض الآخر العمل في R. قد يكون لدى البعض شغفًا ب هندسة البرامج، بينما يرى شخص آخر أنّ المراقبة هي أهم ميزة ، في حين يدرك شخص آخر ممارسات جيدة لاستخدام الميزات في المنتجات، ولكنه يريد استخدام Scala. يكون كل شخص "محقًا" من وجهة نظره، وإذا تم توجيهه بشكل صحيح، سيكون المزيج فعّالاً. وإذا لم يكن الأمر كذلك، قد تصبح الأمور مربكة.

إنّ تحديد الأدوات والعمليات والبنية الأساسية التي سيستخدمها الفريق قبل كتابة سطر من الرموز البرمجية قد يحدّد ما إذا كان المشروع سيفشل بعد عامين أو سيتم إطلاقه بنجاح قبل ربع السنة من الموعد المحدّد.

تقييمات الأداء

بسبب الغموض وعدم اليقين المتأصلَين في الذكاء الاصطناعي، على مدراء الموارد البشرية وضع توقعات واضحة وتحديد النتائج المرجوة في وقت مبكر.

عند تحديد التوقعات والنتائج المرجوة، ضع في اعتبارك كيفية تقييمها في حال عدم نجاح المشروع أو المنهج. بعبارة أخرى، من المهم ألا يكون أداء أحد أعضاء الفريق مرتبطًا مباشرةً بأحد عوامل نجاح المشروع. على سبيل المثال، من الشائع أن يقضي أعضاء الفريق أسابيع في التحقيق في الحلول التي لا تنجح في النهاية. وحتى في هذه الحالات، من المفترض أن تساهم الرموز البرمجية العالية الجودة والمستندات الشاملة والتعاون العميق في تقييمهم بشكل إيجابي.

التحقّق من الفهم

ما هو السبب الأساسي لإعداد مستندات ممتازة حول العمليات ووضع ممارسات شائعة؟
وضع أفضل الممارسات على مستوى الشركة
زيادة سرعة المشروع
تأكَّد من أنّ جميع المهندسين في الفريق لديهم المستوى نفسه من الخبرة.