برای آماده سازی خطوط لوله ML خود برای تولید، باید موارد زیر را انجام دهید:
- منابع محاسباتی را برای خطوط لوله خود فراهم کنید
- ثبت، نظارت و هشدار را اجرا کنید
تامین منابع محاسباتی
اجرای خطوط لوله ML به منابع محاسباتی مانند RAM، CPU و GPU/TPU نیاز دارد. بدون محاسبه کافی، نمی توانید خطوط لوله خود را اجرا کنید. بنابراین، مطمئن شوید که سهمیه کافی برای تامین منابع مورد نیاز خطوط لوله خود را برای اجرای تولید به دست آورده اید.
خدمات، آموزش، و خطوط لوله اعتبار سنجی . این خطوط لوله به TPU، GPU یا CPU نیاز دارند. بسته به مورد استفادهتان، ممکن است روی سختافزارهای مختلف آموزش داده و خدمت کنید یا از سختافزار مشابهی استفاده کنید. به عنوان مثال، ممکن است آموزش روی CPU ها اتفاق بیفتد، اما سرویس دهی ممکن است از TPU ها استفاده کند یا برعکس. به طور کلی، تمرین بر روی سخت افزار بزرگتر و سپس ارائه بر روی سخت افزارهای کوچکتر معمول است.
هنگام انتخاب سخت افزار، موارد زیر را در نظر بگیرید:
- آیا می توانید با سخت افزار ارزان تر تمرین کنید؟
- آیا تعویض سخت افزارهای مختلف باعث افزایش عملکرد می شود؟
- اندازه مدل چقدر است و کدام سخت افزار عملکرد آن را بهینه می کند؟
- چه سخت افزاری بر اساس معماری مدل شما ایده آل است؟
خطوط لوله داده خطوط لوله داده به سهمیه RAM و CPUشما باید تخمین بزنید که خط لوله شما به چه مقدار سهمیه برای تولید آموزش و مجموعه داده های آزمایشی نیاز دارد.
ممکن است برای هر خط لوله سهمیه ای اختصاص ندهید. در عوض، ممکن است سهمیه ای را که خطوط لوله به اشتراک می گذارند اختصاص دهید. در چنین مواردی، بررسی کنید که سهمیه کافی برای اجرای تمام خطوط لوله خود را دارید، و نظارت و تغییر را تنظیم کنید تا از مصرف تمام سهمیه خط لوله منفرد و اشتباه جلوگیری کنید.
تخمین سهمیه
برای تخمین سهمیه ای که برای داده ها و خطوط لوله آموزشی به آن نیاز دارید، پروژه های مشابهی را بیابید تا برآوردهای خود را بر اساس آنها انجام دهید. برای تخمین سهمیه خدمت، سعی کنید درخواست های سرویس را در هر ثانیه پیش بینی کنید. این روش ها یک پایه را ارائه می دهند. همانطور که نمونه سازی یک راه حل را در مرحله آزمایش شروع می کنید، تخمین سهمیه دقیق تری را دریافت خواهید کرد.
هنگام تخمین سهمیه، به یاد داشته باشید که سهمیه را نه تنها برای خطوط لوله تولید خود، بلکه برای آزمایشات در حال انجام نیز در نظر بگیرید.
درک خود را بررسی کنید
ورود به سیستم، نظارت و هشدار
ثبت و نظارت بر رفتار مدل تولید بسیار مهم است. زیرساختهای نظارتی قوی تأیید میکند که مدلهای شما پیشبینیهای قابل اعتماد و باکیفیت را ارائه میکنند.
شیوه های ثبت و نظارت خوب به شناسایی پیشگیرانه مسائل در خطوط لوله ML و کاهش تأثیر بالقوه تجاری کمک می کند. هنگامی که مشکلات رخ می دهد، هشدارها به اعضای تیم شما اطلاع می دهند و گزارش های جامع تشخیص علت اصلی مشکل را تسهیل می کنند.
برای شناسایی مشکلات زیر در خطوط لوله ML باید ثبت و نظارت را اجرا کنید:
خط لوله | نظارت کنید |
---|---|
در حال خدمت کردن |
|
داده ها |
|
آموزش |
|
اعتبار سنجی |
|
همچنین میخواهید برای موارد زیر ثبتنام، نظارت و هشدار دهید:
- تاخیر . چه مدت طول می کشد تا یک پیش بینی ارائه شود؟
- قطعی ها آیا مدل ارائه پیش بینی ها را متوقف کرده است؟
درک خود را بررسی کنید
استقرار یک مدل
برای استقرار مدل، باید موارد زیر را مستند کنید:
- تأییدیه های لازم برای شروع استقرار و افزایش عرضه.
- چگونه یک مدل را وارد تولید کنیم.
- جایی که مدل مستقر می شود، برای مثال، اگر محیط های صحنه یا قناری وجود داشته باشد.
- اگر استقرار با شکست مواجه شد چه باید کرد.
- چگونه می توان مدلی را که در حال تولید است برگردانید.
پس از آموزش خودکارسازی مدل، میخواهید اعتبارسنجی و استقرار را خودکار کنید. استقرار خودکار مسئولیت ها را توزیع می کند و احتمال اینکه استقرار توسط یک نفر با تنگنا مواجه شود را کاهش می دهد. همچنین خطاهای بالقوه را کاهش می دهد، کارایی و قابلیت اطمینان را افزایش می دهد و چرخش در تماس و پشتیبانی SRE را فعال می کند.
معمولاً مدلهای جدید را برای زیرمجموعهای از کاربران مستقر میکنید تا بررسی کنید که مدل مطابق انتظار رفتار میکند. اگر چنین است، به استقرار ادامه دهید. اگر اینطور نیست، استقرار را برگردانید و شروع به تشخیص و رفع اشکال کنید.