أنظمة تعلُّم الآلة للإنتاج: التدريب الثابت مقابل التدريب الديناميكي
بشكل عام، يمكنك تدريب نموذج بطريقتَين:
التدريب الثابت (يُعرف أيضًا باسم التدريب بلا إنترنت) يعني تدريب نموذج
مرّة واحدة فقط. بعد ذلك، يتم عرض النموذج نفسه المدّرب لبعض الوقت.
التدريب الديناميكي (يُعرف أيضًا باسم التدريب على الإنترنت) يعني تدريب نموذج باستمرار أو بشكل متكرّر على الأقل. وعادةً ما يتم عرض النموذج الذي تم تدريبه
مؤخرًا.
الجدول 1: المزايا والعيوب الأساسية
التدريب الثابت
التدريب الديناميكي
الإيجابيات
أكثر بساطة: ما عليك سوى تطوير النموذج واختباره مرة واحدة.
أكثر ملاءمةً سيتلاءم النموذج مع أي
تغييرات في العلاقة بين الميزات والتصنيفات.
السلبيات
أحيانًا تكون البيانات قديمة. إذا تغيّرت العلاقة بين السمات
والعلامات بمرور الوقت، ستنخفض توقّعات النموذج.
مزيد من العمل: يجب إنشاء منتج جديد واختباره وإصداره
باستمرار.
إذا كانت مجموعة بياناتك لا تتغيّر حقًا بمرور الوقت، اختَر التدريب الثابت لأنّه
يُعدّ أرخص من حيث الإنشاء والصيانة مقارنةً بالتدريب الديناميكي. ومع ذلك، تميل مجموعات البيانات
إلى التغيير بمرور الوقت، حتى تلك التي تحتوي على ميزات تعتقد أنّها
ثابتة مثل مستوى سطح البحر مثلاً. الخلاصة: حتى في حال استخدام أسلوب
التدريب الثابت، يجب مراقبة بيانات الإدخال بحثًا عن أي تغييرات.
على سبيل المثال، نأخذ نموذجًا تم تدريبه لتوقّع احتمالية شراء المستخدِمين للزهور. بسبب الضغوطات الزمنية، يتم تدريب النموذج مرة واحدة فقط باستخدام مجموعة بيانات عن سلوك شراء الزهور خلال شهرَي تموز (يوليو) وأغسطس (آب).
يعمل النموذج بشكل جيد لعدة أشهر، ولكنه يقدّم توقّعات سيئة في عيد الحب لأنّ سلوك المستخدِم يتغيّر بشكل كبير خلال فترة الأعياد المرتبطة بالزهور.
للاطّلاع على استكشاف أكثر تفصيلاً للتدريب الثابت والديناميكي، اطّلِع على دورة التعلم العميق
إدارة مشاريع الذكاء الاصطناعي.
تمارين: التحقّق من فهمك
أي عبارتَين من العبارات التالية صحيحتَين بشأن
التدريب الثابت (غير المتصل بالإنترنت)؟
ويبقى النموذج محدّثًا عند وصول بيانات جديدة.
في الواقع، إذا كنت تُجري التدريب بلا اتصال بالإنترنت، لن يكون لدى النموذج طريقة
لإدراج البيانات الجديدة عند وصولها. ويمكن أن يؤدّي ذلك إلى عدم حداثة النموذج، إذا كان التوزيع الذي تحاول التعلّم منه
يتغيّر بمرور الوقت.
يمكنك التحقّق من النموذج قبل تطبيقه في مرحلة الإنتاج.
نعم، يقدّم التدريب بلا إنترنت فرصة كبيرة للتحقّق من أداء النموذج
قبل طرحه في مرحلة الإنتاج.
تتطلّب التدريبات بلا إنترنت مراقبة أقل لوظائف التدريب مقارنةً بالتدريب على الإنترنت.
بشكل عام، تكون متطلبات المراقبة في وقت التدريب أقل تطلبًا
في التدريب بلا إنترنت، ما يحميك من العديد من الملاحظات
المتعلقة بالإنتاج. ومع ذلك، كلما زادت وتيرة تدريب النموذج،
زادت التكلفة التي يجب أن تتحملها في عملية المراقبة. عليك
أيضًا التحقّق من الصحة بانتظام للتأكّد من أنّ التغييرات التي تطرأ على الرمز
(والتبعيات) لا تؤثّر سلبًا في جودة النموذج.
لا يلزم إجراء الكثير من عمليات المراقبة لبيانات الإدخال في
وقت الاستنتاج.
على عكس ما قد تعتقد، عليك مراقبة بيانات الإدخال أثناء عرض الإعلانات. إذا تغيّرت توزيعات الإدخال، قد تصبح توقّعات نموذجنا
غير موثوقة. على سبيل المثال، تخيل نموذجًا
تم تدريبه فقط على بيانات الملابس في الصيف، ويتم استخدامه فجأة لمحاولة
تنبؤ سلوك شراء الملابس في الشتاء.
أي عبارة من العبارات التالية صحيحة بشأن
التدريب الديناميكي (على الإنترنت)؟
ويبقى النموذج محدّثًا عند وصول بيانات جديدة.
هذه هي الفائدة الأساسية من التدريب على الإنترنت، إذ يمكنك تجنُّب العديد من
المشاكل المتعلّقة بحداثة البيانات من خلال السماح للنموذج بالتدريب على بيانات جديدة عند
وصولها.
لا يلزم إجراء الكثير من عمليات المراقبة لوظائف التدريب.
في الواقع، عليك تتبُّع مهام التدريب باستمرار للتأكّد من
أنّها تعمل على النحو المطلوب. ستحتاج أيضًا إلى
البنية الأساسية الداعمة، مثل إمكانية إعادة أحد النماذج
إلى لقطة سابقة في حال حدوث خطأ في عملية التدريب،
مثل حدوث خطأ في إحدى المهام أو تلف في بيانات الإدخال.
لا يلزم إجراء الكثير من عمليات المراقبة لبيانات الإدخال في
وقت الاستنتاج.
تمامًا مثل النموذج الثابت بلا إنترنت، من المهم أيضًا
تتبُّع المدخلات إلى النماذج التي يتم تعديلها ديناميكيًا. من غير المرجّح أن تكون لديك
مشاكل كبيرة بسبب العوامل الموسمية، ولكن قد تؤدي التغيّرات المفاجئة والكبيرة في المدخلات (مثل توقّف مصدر بيانات في مرحلة ما قبل المعالجة) إلى توقّعات غير موثوقة.