سیستم های ML تولید: آموزش استاتیک در مقابل پویا

به طور کلی، شما می توانید یک مدل را به دو روش آموزش دهید:

  • آموزش استاتیک (که به آن آموزش آفلاین نیز گفته می شود) به این معنی است که شما یک مدل را فقط یک بار آموزش می دهید. سپس برای مدتی به همان مدل آموزش دیده خدمت می کنید.
  • آموزش پویا (که به آن آموزش آنلاین نیز گفته می شود) به این معنی است که شما یک مدل را به طور مداوم یا حداقل مکرر آموزش می دهید. شما معمولاً جدیدترین مدل آموزش دیده را خدمت می کنید.
شکل 2. خمیر خام سه قرص نان یکسان ایجاد می کند.
شکل 2. آموزش استاتیک. یک بار قطار؛ یک مدل ساخته شده را چندین بار خدمت کنید. (تصاویر توسط Pexels و توسط fancycrave1.)

شکل 3. خمیر خام هر بار نان های کمی متفاوت ایجاد می کند.
شکل 3. آموزش پویا. مرتباً بازآموزی کنید؛ جدیدترین مدل ساخته شده را ارائه می دهد. (تصاویر توسط Pexels و Couleur.)

جدول 1. مزایا و معایب اولیه.

آموزش استاتیک آموزش پویا
مزایا ساده تر. شما فقط باید یک بار مدل را توسعه و آزمایش کنید. سازگارتر مدل شما با هرگونه تغییر در رابطه بین ویژگی‌ها و برچسب‌ها مطابقت خواهد داشت.
معایب گاهی بیات تر. اگر رابطه بین ویژگی ها و برچسب ها در طول زمان تغییر کند، پیش بینی های مدل شما کاهش می یابد. کار بیشتر شما باید همیشه یک محصول جدید بسازید، آزمایش کنید و منتشر کنید.

اگر مجموعه داده شما واقعاً در طول زمان تغییر نمی کند، آموزش استاتیک را انتخاب کنید زیرا ایجاد و نگهداری از آموزش پویا ارزان تر است. با این حال، مجموعه داده‌ها در طول زمان تغییر می‌کنند، حتی آن‌هایی که ویژگی‌هایی دارند که فکر می‌کنید مانند سطح دریا ثابت هستند. غذای آماده: حتی با آموزش استاتیک، همچنان باید داده های ورودی خود را برای تغییر کنترل کنید.

به عنوان مثال، مدلی را در نظر بگیرید که برای پیش بینی احتمال خرید گل توسط کاربران آموزش دیده است. به دلیل فشار زمانی، مدل تنها یک بار با استفاده از مجموعه داده رفتار خرید گل در ماه های جولای و آگوست آموزش داده می شود. این مدل برای چندین ماه خوب کار می کند اما پس از آن پیش بینی های وحشتناکی را در مورد روز ولنتاین انجام می دهد زیرا رفتار کاربر در آن دوره تعطیلات گل به طور چشمگیری تغییر می کند.

برای کاوش دقیق تر در مورد آموزش استاتیک و پویا، دوره مدیریت پروژه های ML را ببینید.

تمرینات: درک خود را بررسی کنید

کدام دو عبارت زیر در مورد آموزش استاتیک (آفلاین) صحیح است؟
با رسیدن داده های جدید، مدل به روز می ماند.
در واقع، اگر به صورت آفلاین تمرین می‌کنید، مدل هیچ راهی برای ترکیب داده‌های جدید در زمان رسیدن ندارد. اگر توزیعی که می‌خواهید از آن بیاموزید در طول زمان تغییر کند، این می‌تواند منجر به کهنگی مدل شود.
شما می توانید مدل را قبل از استفاده از آن در تولید بررسی کنید.
بله، آموزش آفلاین فرصت کافی برای بررسی عملکرد مدل قبل از معرفی مدل در تولید می دهد.
آموزش آفلاین به نظارت کمتری بر مشاغل آموزشی نسبت به آموزش آنلاین نیاز دارد.
به طور کلی، الزامات نظارت در زمان آموزش برای آموزش آفلاین کمتر است، که شما را از بسیاری از ملاحظات تولید محافظت می کند. با این حال، هر چه بیشتر مدل خود را آموزش دهید، سرمایه‌گذاری بیشتری باید در نظارت انجام دهید. همچنین باید به طور منظم اعتبارسنجی کنید تا مطمئن شوید که تغییرات در کد شما (و وابستگی‌های آن) بر کیفیت مدل تأثیر منفی نمی‌گذارد.
نظارت بسیار کمی بر داده های ورودی باید در زمان استنتاج انجام شود.
در مقابل، شما نیاز به نظارت بر داده های ورودی در زمان ارائه خدمات دارید. اگر توزیع های ورودی تغییر کند، پیش بینی های مدل ما ممکن است غیر قابل اعتماد شوند. برای مثال تصور کنید، مدلی که فقط بر اساس داده‌های لباس تابستانی آموزش دیده است، ناگهان برای پیش‌بینی رفتار خرید لباس در فصل زمستان استفاده می‌شود.
کدام یک از عبارات زیر در مورد آموزش پویا (آنلاین) صادق است؟
با رسیدن داده های جدید، مدل به روز می ماند.
این مزیت اصلی آموزش آنلاین است. می‌توانید با اجازه دادن به مدل برای آموزش داده‌های جدید در هنگام ورود، از بسیاری از مشکلات کهنگی جلوگیری کنید.
نظارت بسیار کمی بر مشاغل آموزشی باید انجام شود.
در واقع، شما باید به طور مداوم مشاغل آموزشی را زیر نظر داشته باشید تا مطمئن شوید که آنها سالم هستند و طبق برنامه کار می کنند. همچنین به زیرساخت‌های پشتیبانی مانند توانایی بازگرداندن یک مدل به عکس قبلی در صورت بروز مشکل در آموزش، مانند کار باگ یا خرابی در داده‌های ورودی، نیاز دارید.
نظارت بسیار کمی بر داده های ورودی باید در زمان استنتاج انجام شود.
درست مانند یک مدل استاتیک و آفلاین، نظارت بر ورودی‌های مدل‌های به‌روزرسانی شده پویا نیز مهم است. شما احتمالاً در معرض خطر تأثیرات فصلی زیاد نیستید، اما تغییرات ناگهانی و بزرگ در ورودی‌ها (مانند از بین رفتن منبع داده بالادست) همچنان می‌تواند باعث پیش‌بینی‌های غیرقابل اعتماد شود.