أنظمة تعلُّم الآلة للإنتاج: التدريب الثابت مقابل التدريب الديناميكي
بوجه عام، يمكنك تدريب أي نموذج بطريقتين:
التدريب الثابت (أيضًا
تسمى التدريب بلا اتصال) تعني أنك تقوم بتدريب نموذج
مرة واحدة فقط. وبعد ذلك، تستخدم النموذج نفسه المدرَّب لفترة من الوقت.
التدريب الديناميكي (أيضًا
تسمى التدريب عبر الإنترنت) تعني أنك تقوم بتدريب نموذج
باستمرار أو على الأقل بشكل متكرر. أنت عادةً ما تحظى بأكبر قدر من
التدرب على نماذج أخرى مؤخرًا.
الجدول 1. المزايا والعيوب الأساسية.
تدريب ثابت
تدريب ديناميكي
الإيجابيات
أكثر بساطة تحتاج فقط إلى تطوير النموذج واختباره مرة واحدة.
أكثر قابلية للتكيف: سوف يواكب نموذجك أي
التغييرات على العلاقة بين الميزات والتسميات.
العيوب
قد تكون أكثر استقرارًا في بعض الأحيان. إذا كانت العلاقة بين الميزات
تتغير التصنيفات بمرور الوقت، ستنخفض توقّعات النموذج.
المزيد من العمل يجب إنشاء منتج جديد واختباره وإصداره.
طوال الوقت.
إذا كانت مجموعة البيانات الخاصة بك لا تتغير حقًا بمرور الوقت، فاختر التدريب الثابت لأن
يكون الإنشاء والصيانة أقل تكلفة من التدريب الديناميكي. ومع ذلك، فإن مجموعات البيانات
تميل إلى التغيير بمرور الوقت، حتى تلك التي بها ميزات تعتقد أنها
ثابتًا مثل مستوى سطح البحر على سبيل المثال. النصيحة الرئيسية: حتى مع وجود
التدريب، فلا يزال يتعين عليك مراقبة بيانات الإدخال بحثًا عن التغيير.
على سبيل المثال، بالنظر إلى نموذج تم تدريبه على توقع احتمالية أن المستخدمين
سوف يشتري الزهور. وبسبب ضغط الوقت، يتم تدريب النموذج مرة واحدة فقط
باستخدام مجموعة بيانات لسلوك شراء الزهور خلال تموز (يوليو) وآب (أغسطس).
يعمل هذا النموذج بشكل جيد لعدة أشهر، ولكنه يقدّم تنبؤات سيئة بعد ذلك
في حوالي عيد الحب لأن
يتغير سلوك المستخدم خلال فترة عطلة الزهور تلك بشكل كبير.
لاستكشاف التدريب الثابت والديناميكي بشكل أكثر تفصيلاً، اطّلِع على
إدارة مشاريع تعلُّم الآلة
دورة سابقة.
تمارين: التحقق من فهمك
أي من العبارات التالية صواب حول اثنين
تدريب ثابت (دون اتصال)؟
ويبقى النموذج محدّثًا عند وصول بيانات جديدة.
وفي الواقع، إذا كنت تتدرب بدون اتصال بالإنترنت، فلن يكون للنموذج أي وسيلة
ودمج البيانات الجديدة عند وصولها. وهذا يمكن أن يؤدي إلى وضع
أو القِدم، إذا كان التوزيع الذي تحاول التعلم منه
التغييرات بمرور الوقت.
يمكنك التحقّق من النموذج قبل تطبيقه في مرحلة الإنتاج.
نعم، يمنح التدريب بلا اتصال فرصة كبيرة للتحقق من النموذج
الأداء قبل إدخال النموذج في الإنتاج.
يتطلب التدريب بلا اتصال مراقبة أقل لوظائف التدريب
من التدريب عبر الإنترنت.
وبوجه عام، تكون متطلبات المراقبة في وقت التدريب أكثر تواضعًا
للتدريب بلا اتصال بالإنترنت، مما يعزلك عن العديد من الإنتاج
اعتبارات. ومع ذلك، كلّما تدربت على النموذج أكثر،
زاد الاستثمار الذي ستحتاج إلى إجرائه في المراقبة. وسوف
تريد أيضًا التحقق منه بانتظام للتأكد من أن التغييرات التي تطرأ على التعليمات البرمجية
(وتبعياته) لا تؤثر سلبًا في جودة النموذج.
يجب إجراء القليل جدًا من مراقبة بيانات الإدخال
وقت الاستنتاج.
أنت بحاجة إلى تتبُّع البيانات التي تم إدخالها، وذلك بطريقة عكسية أثناء عرض
الوقت. وإذا تغيرت توزيعات المدخلات، فإن نموذجنا
والتنبؤات غير موثوقة. تخيل، على سبيل المثال، نموذج
التدريب فقط على بيانات الملابس الصيفية التي تم استخدامها فجأة
التنبؤ بسلوك شراء الملابس في فصل الشتاء.
أيٌّ من العبارات التالية ينطبق على إحدى العبارات التالية:
تدريب ديناميكي (عبر الإنترنت)؟
ويبقى النموذج محدّثًا عند وصول بيانات جديدة.
هذه هي الفائدة الأساسية للتدريب عبر الإنترنت؛ يمكنك تجنب العديد
بشأن تلف البيانات من خلال السماح للنموذج بالتدريب على البيانات الجديدة
الوصول إليه.
حيث يلزم إجراء القليل من مراقبة وظائف التدريب.
في الواقع، يجب عليك مراقبة وظائف التدريب باستمرار للتأكد من
أنها صحية وتعمل على النحو المنشود. ستحتاج أيضًا إلى
البنية الأساسية الداعمة مثل القدرة على تراجع النموذج
إلى لقطة سابقة في حالة حدوث خطأ ما في التدريب،
مثل عمل عربات التي تجرها العربات أو تلف بيانات المدخلات.
يجب إجراء القليل جدًا من مراقبة بيانات الإدخال
وقت الاستنتاج.
وكما هو الحال في أي نموذج ثابت غير متصل، من المهم أيضًا أن:
ومراقبة المدخلات إلى النماذج التي يتم تحديثها ديناميكيًا. أنت
من المحتمل ألا تكون عرضة لتأثيرات موسمية كبيرة، ولكنها مفاجئة،
التغييرات الكبيرة على المدخلات (مثل استخدام مصدر بيانات رئيسي
إلى تنبؤات غير موثوقة).