أنظمة تعلُّم الآلة للإنتاج: اختبار النشر

أنت الآن جاهز لنشر نموذج أحادي القرن الذي يتوقّع ظهور أحادي القرن. عند نشر مسار تعلُّم الآلة، من المفترض أن يتم تشغيله وتعديله و تقديمه بدون أي مشكلة. لو كان نشر النموذج سهلًا مثل الضغط على زر نشر كبير. يتطلّب نظام تعلُّم الآلة الكامل إجراء اختبارات بشأن ما يلي:

  • التحقّق من صحة بيانات الإدخال
  • التحقّق من هندسة الخصائص
  • التحقّق من جودة إصدارات النماذج الجديدة
  • التحقّق من صحة البنية الأساسية لعرض الإعلانات
  • اختبار الدمج بين مكوّنات مسار الإحالة الناجحة

يفضّل العديد من مهندسي البرمجيات استخدام أسلوب التطوير بالاستناد إلى الاختبارات (TDD). في أسلوب TDD، يكتب مهندسو البرامج الاختبارات قبل كتابة الرمز المصدر "الحقيقي". ومع ذلك، يمكن أن يكون اختبار التطوير المتقدّم أمرًا صعبًا في تعلُّم الآلة. على سبيل المثال، قبل تدريب النموذج، لا يمكنك كتابة اختبار للتحقّق من الخسارة. بدلاً من ذلك، عليك أولاً اكتشاف الخسارة التي يمكن تحقيقها أثناء تطوير النموذج، وثم اختبار إصدارات النموذج الجديدة مقارنةً بالخسارة التي يمكن تحقيقها.

لمحة عن نموذج Unicorn

يشير هذا القسم إلى نموذج شركة يونيكورن. في ما يلي ما تحتاج إلى معرفته:

أنت تستخدِم تعلُّم الآلة لبناء نموذج تصنيف يتنبّأ بظهور وحيد القرن. توضّح مجموعة البيانات 10,000 مرّة ظهور لحيوانات أحادية القرن و 10,000 مرّة عدم ظهور. تحتوي مجموعة البيانات على الموقع الجغرافي، والوقت من اليوم، والارتفاع، ودرجة الحرارة، والرطوبة، والغطاء النباتي، ومدى ظهور قوس قزح، والعديد من الميزات الأخرى.

اختبار تعديلات النموذج باستخدام تدريب قابل للتكرار

قد تريد مواصلة تحسين نموذج حيوان أحادي القرن. على سبيل المثال، لنفترض أنّك أجريت بعض عمليات هندسة الميزات الإضافية على ميزة معيّنة ثم أعددت تدريب النموذج على أمل الحصول على نتائج أفضل (أو على الأقلّ النتائج نفسها). يصعب أحيانًا إعادة تدريب النموذج. لتحسين إمكانية إعادة الإجراء، اتّبِع الاقتراحات التالية:

  • إنشاء بذرة محددة لأداة إنشاء الأرقام العشوائية لمعرفة التفاصيل، يُرجى الاطّلاع على التعشّب في عملية إنشاء البيانات.

  • يمكنك إعداد مكوّنات النموذج بترتيب ثابت لضمان حصول المكوّنات على العدد العشوائي نفسه من أداة إنشاء الأرقام العشوائية في كل مرة. تعالج مكتبات الذكاء الاصطناعي هذا الشرط تلقائيًا في العادة.

  • احتساب متوسط عدة عمليات تنفيذ للنموذج

  • استخدِم ميزة التحكّم في الإصدارات، حتى في عمليات التكرار الأولية، حتى تتمكّن من تحديد الرمز البرمجي والمَعلمات عند التحقيق في النموذج أو مسار الإحالة الناجحة.

حتى بعد اتّباع هذه الإرشادات، قد تظل هناك مصادر أخرى لعدم تحديد المسار.

اختبار طلبات البيانات من واجهة برمجة تطبيقات تعلُّم الآلة

كيف تختبر التعديلات على طلبات البيانات من واجهة برمجة التطبيقات؟ يمكنك إعادة تدريب النموذج، ولكن يتطلب ذلك الكثير من الوقت. بدلاً من ذلك، يمكنك كتابة اختبار وحدة لإنشاء بيانات إدخال عشوائية وتنفيذ خطوة واحدة من التدرج التنازلي. إذا اكتملت هذه الخطوة بدون أخطاء، هذا يعني أنّ أي تعديلات على واجهة برمجة التطبيقات لم تؤثر في نموذجك.

كتابة اختبارات الدمج لمكوّنات مسار الإحالة الناجحة

في مسار تعلُّم الآلة، يمكن أن تؤدي التغييرات في أحد المكوّنات إلى حدوث أخطاء في المكوّنات الأخرى. تأكَّد من أنّ المكوّنات تعمل معًا من خلال كتابة اختبار دمج يشغّل مسار الإحالة الناجحة بالكامل من البداية إلى النهاية.

بالإضافة إلى إجراء اختبارات الدمج باستمرار، يجب إجراء اختبارات الدمج عند طرح نماذج جديدة وإصدارات جديدة من البرامج. إنّ بطء تشغيل المسار بأكمله يجعل اختبار الدمج المستمر أكثر صعوبة. لإجراء اختبارات الدمج بشكل أسرع، يمكنك التدريب على مجموعة فرعية من البيانات أو باستخدام نموذج أبسط. تعتمد التفاصيل على النموذج والبيانات. للحصول على تغطية مستمرة، عليك تعديل الاختبارات الأسرع لكي يتم تشغيلها مع كل إصدار جديد من النموذج أو البرنامج. وفي الوقت نفسه، سيتم تنفيذ الاختبارات البطيئة باستمرار في الخلفية.

التحقّق من جودة النموذج قبل عرضه

قبل طرح إصدار جديد من النموذج في قناة الإصدار العلني، عليك اختباره بحثًا عن نوعَي تدهور الجودة التاليَين:

  • الانخفاض المفاجئ في الأداء: يمكن أن يؤدي خطأ في الإصدار الجديد إلى خفض الجودة بشكلٍ ملحوظ. التحقّق من صحة الإصدارات الجديدة من خلال التحقّق من جودتها مقارنةً بالإصدار السابق

  • الانخفاض البطيء في الأداء: قد لا يرصد اختبار الانخفاض المفاجئ في الأداء تدهورًا بطيئًا في جودة النموذج على مدار عدة إصدارات. بدلاً من ذلك، تأكَّد من أنّ توقّعات النموذج على مجموعة بيانات التحقّق تستوفي حدًا أدنى ثابتًا. إذا كانت مجموعة بيانات التحقّق تختلف عن البيانات المنشورة، عليك تعديل مجموعة بيانات التحقّق والتأكّد من أنّ النموذج لا يزال يستوفي الحدّ الأدنى نفسه للجودة.

التحقّق من توافق البنية الأساسية للنموذج قبل عرضه

إذا تم تعديل النموذج بشكل أسرع من الخادم، قد يكون للنموذج اعتمادات برامج مختلفة عن الخادم، ما قد يؤدي إلى عدم التوافق. تأكَّد من توفّر العمليات التي يستخدمها النموذج في الخادم من خلال إعداد النموذج في إصدار مُخصّص للاختبار في بيئة مغلقة من الخادم.