التدريب العملي في مجال تعلّم الآلة: تصنيف الصور

منع فرط التخصيص

كما هو الحال مع أي نموذج تعلُّم آلي، فإنّ أحد المخاوف الرئيسية عند تدريب شبكة عصبية مرتّبة هو الملاءمة الزائدة: وهو نموذج تم ضبطه وفقًا لتفاصيل البيانات التدريبية لدرجة أنّه لا يمكنه التعميم على الأمثلة الجديدة. في ما يلي طريقتان لتجنُّب التطابق المفرط عند إنشاء شبكة عصبية تلافعية:

  • زيادة البيانات: زيادة التنوع وعدد مثاليّات التدريب بشكل مصطنع من خلال إجراء عمليات تحويل عشوائية للصور الحالية لإنشاء مجموعة من الصيغ الجديدة (راجِع الشكل 7). تكون ميزة "تعزيز البيانات" مفيدة بشكلٍ خاص عندما تكون مجموعة بيانات التدريب الأصلية صغيرة نسبيًا.
  • تسويف الإزالة: إزالة وحدات عشوائيًا من الشبكة العصبية أثناء خطوة تدريب التدرج.

مخطّط بياني لزيادة البيانات في صورة كلب واحدة، ما يؤدي إلى إنشاء 9 صور جديدة من خلال
عمليات تحويل عشوائية الشكل 7. زيادة البيانات على صورة كلب واحدة (مقتطف من مجموعة بيانات"الكلاب مقابل القطط" المتوفّرة على Kaggle) اليسار: صورة الكلب الأصلية من مجموعة التدريب على اليمين: تسع صور جديدة تم إنشاؤها من الصورة الأصلية باستخدام عمليات تحويل عشوائية.