تولید

برای آماده سازی خطوط لوله ML خود برای تولید، باید موارد زیر را انجام دهید:

  • منابع محاسباتی را برای خطوط لوله خود فراهم کنید
  • ثبت، نظارت و هشدار را اجرا کنید

تامین منابع محاسباتی

اجرای خطوط لوله ML به منابع محاسباتی مانند RAM، CPU و GPU/TPU نیاز دارد. بدون محاسبه کافی، نمی توانید خطوط لوله خود را اجرا کنید. بنابراین، مطمئن شوید که سهمیه کافی برای تامین منابع مورد نیاز خطوط لوله خود را برای اجرای تولید به دست آورده اید.

  • خدمات، آموزش، و خطوط لوله اعتبار سنجی . این خطوط لوله به TPU، GPU یا CPU نیاز دارند. بسته به مورد استفاده‌تان، ممکن است روی سخت‌افزارهای مختلف آموزش داده و خدمت کنید یا از سخت‌افزار مشابهی استفاده کنید. به عنوان مثال، ممکن است آموزش روی CPU ها اتفاق بیفتد، اما سرویس دهی ممکن است از TPU ها استفاده کند یا برعکس. به طور کلی، تمرین بر روی سخت افزار بزرگتر و سپس ارائه بر روی سخت افزارهای کوچکتر معمول است.

    هنگام انتخاب سخت افزار، موارد زیر را در نظر بگیرید:

    • آیا می توانید با سخت افزار ارزان تر تمرین کنید؟
    • آیا تعویض سخت افزارهای مختلف باعث افزایش عملکرد می شود؟
    • اندازه مدل چقدر است و کدام سخت افزار عملکرد آن را بهینه می کند؟
    • چه سخت افزاری بر اساس معماری مدل شما ایده آل است؟
  • خطوط لوله داده خطوط لوله داده به سهمیه RAM و CPUشما باید تخمین بزنید که خط لوله شما به چه مقدار سهمیه برای تولید آموزش و مجموعه داده های آزمایشی نیاز دارد.

ممکن است برای هر خط لوله سهمیه ای اختصاص ندهید. در عوض، ممکن است سهمیه ای را که خطوط لوله به اشتراک می گذارند اختصاص دهید. در چنین مواردی، بررسی کنید که سهمیه کافی برای اجرای تمام خطوط لوله خود را دارید، و نظارت و تغییر را تنظیم کنید تا از مصرف تمام سهمیه خط لوله منفرد و اشتباه جلوگیری کنید.

تخمین سهمیه

برای تخمین سهمیه ای که برای داده ها و خطوط لوله آموزشی به آن نیاز دارید، پروژه های مشابهی را بیابید تا برآوردهای خود را بر اساس آنها انجام دهید. برای تخمین سهمیه خدمت، سعی کنید درخواست های سرویس را در هر ثانیه پیش بینی کنید. این روش ها یک پایه را ارائه می دهند. همانطور که نمونه سازی یک راه حل را در مرحله آزمایش شروع می کنید، تخمین سهمیه دقیق تری را دریافت خواهید کرد.

هنگام تخمین سهمیه، به یاد داشته باشید که سهمیه را نه تنها برای خطوط لوله تولید خود، بلکه برای آزمایشات در حال انجام نیز در نظر بگیرید.

درک خود را بررسی کنید

هنگام انتخاب سخت‌افزار برای ارائه پیش‌بینی‌ها، همیشه باید سخت‌افزار قدرتمندتری نسبت به آنچه برای آموزش مدل استفاده می‌شد انتخاب کنید.
نادرست
درست. به طور معمول، آموزش به سخت افزار بزرگتر از خدمت نیاز دارد.
درست است، واقعی

ورود به سیستم، نظارت و هشدار

ثبت و نظارت بر رفتار مدل تولید بسیار مهم است. زیرساخت‌های نظارتی قوی تأیید می‌کند که مدل‌های شما پیش‌بینی‌های قابل اعتماد و باکیفیت را ارائه می‌کنند.

شیوه های ثبت و نظارت خوب به شناسایی پیشگیرانه مسائل در خطوط لوله ML و کاهش تأثیر بالقوه تجاری کمک می کند. هنگامی که مشکلات رخ می دهد، هشدارها به اعضای تیم شما اطلاع می دهند و گزارش های جامع تشخیص علت اصلی مشکل را تسهیل می کنند.

برای شناسایی مشکلات زیر در خطوط لوله ML باید ثبت و نظارت را اجرا کنید:

خط لوله نظارت کنید
در حال خدمت کردن
  • انحراف یا انحراف در داده های ارائه شده در مقایسه با داده های آموزشی
  • انحراف یا انحراف در پیش بینی ها
  • مشکلات نوع داده، مانند مقادیر گم شده یا خراب
  • استفاده از سهمیه
  • معیارهای کیفیت مدل
داده ها
  • انحراف و تغییر در مقادیر ویژگی
  • انحراف و تغییر در مقادیر برچسب
  • مشکلات نوع داده، مانند مقادیر گم شده یا خراب
  • نرخ استفاده از سهمیه
  • حدود سهمیه در حال رسیدن است
آموزش
  • زمان تمرین
  • شکست های آموزشی
  • استفاده از سهمیه
اعتبار سنجی
  • انحراف یا رانش در مجموعه داده های آزمایشی

همچنین می‌خواهید برای موارد زیر ثبت‌نام، نظارت و هشدار دهید:

  • تاخیر . چه مدت طول می کشد تا یک پیش بینی ارائه شود؟
  • قطعی ها آیا مدل ارائه پیش بینی ها را متوقف کرده است؟

درک خود را بررسی کنید

کدام یک از موارد زیر دلیل اصلی ثبت و نظارت بر خطوط لوله ML شماست؟
قبل از اینکه روی کاربران تاثیر بگذارد، مشکلات را به طور فعال شناسایی کنید
ردیابی سهمیه و استفاده از منابع
مشکلات امنیتی احتمالی را شناسایی کنید
همه موارد بالا
درست. ثبت و نظارت بر خطوط لوله ML شما به پیشگیری و تشخیص مشکلات قبل از جدی شدن آنها کمک می کند.

استقرار یک مدل

برای استقرار مدل، باید موارد زیر را مستند کنید:

  • تأییدیه های لازم برای شروع استقرار و افزایش عرضه.
  • چگونه یک مدل را وارد تولید کنیم.
  • جایی که مدل مستقر می شود، برای مثال، اگر محیط های صحنه یا قناری وجود داشته باشد.
  • اگر استقرار با شکست مواجه شد چه باید کرد.
  • چگونه می توان مدلی را که در حال تولید است برگردانید.

پس از آموزش خودکارسازی مدل، می‌خواهید اعتبارسنجی و استقرار را خودکار کنید. استقرار خودکار مسئولیت ها را توزیع می کند و احتمال اینکه استقرار توسط یک نفر با تنگنا مواجه شود را کاهش می دهد. همچنین خطاهای بالقوه را کاهش می دهد، کارایی و قابلیت اطمینان را افزایش می دهد و چرخش در تماس و پشتیبانی SRE را فعال می کند.

معمولاً مدل‌های جدید را برای زیرمجموعه‌ای از کاربران مستقر می‌کنید تا بررسی کنید که مدل مطابق انتظار رفتار می‌کند. اگر چنین است، به استقرار ادامه دهید. اگر اینطور نیست، استقرار را برگردانید و شروع به تشخیص و رفع اشکال کنید.