مروری بر خطوط لوله ML

تبریک می گویم! مدل شما آماده استقرار در خط لوله ML تولیدی است. این بخش از دوره دستورالعمل‌های تست خطوط لوله ML را معرفی می‌کند. با این حال، این بخش این دستورالعمل ها را نشان نمی دهد زیرا چنین نسخه ی نمایشی در یک محیط sandbox امکان پذیر نیست.

شما در مورد:

  • نوشتن تست های مناسب برای راه اندازی و تولید.
  • تشخیص حالت های خرابی در خط لوله ML خود با استفاده از آزمایش ها.
  • ارزیابی کیفیت مدل شما در تولید

خط لوله ML چیست؟

همانطور که نمودار نشان می دهد یک خط لوله ML از چندین جزء تشکیل شده است. بعدا با این اجزا آشنا می شویم. در حال حاضر، توجه داشته باشید که "مدل" (جعبه سیاه) بخش کوچکی از زیرساخت خط لوله لازم برای تولید ML است.

شماتیک یک خط لوله یادگیری ماشین معمولی. شماتیک چندین جعبه را نشان می دهد، یکی برای هر جزء خط لوله. کادر با عنوان "مدل" در مرکز شماتیک قرار دارد. جعبه های دیگر در اطراف جعبه "مدل" مرتب شده اند. این جعبه ها دارای برچسب هستند: جمع آوری داده ها، تأیید داده ها، مدیریت منابع ماشین، زیرساخت خدمت، استخراج ویژگی، ابزارهای تجزیه و تحلیل، ابزارهای مدیریت فرآیند، پیکربندی و نظارت.
شکل 1: شماتیک یک خط لوله یادگیری ماشین معمولی.

نقش تست در خطوط لوله ML

در توسعه نرم افزار، گردش کار ایده آل به دنبال توسعه آزمایش محور (TDD) است. با این حال، در ML، شروع با تست ها ساده نیست. تست های شما به داده ها، مدل و مشکل شما بستگی دارد. به عنوان مثال، قبل از آموزش مدل خود، نمی توانید تستی برای تایید ضرر بنویسید. در عوض، زیان قابل دستیابی را در طول توسعه مدل کشف می‌کنید و سپس نسخه‌های مدل جدید را در برابر ضرر قابل دستیابی آزمایش می‌کنید.

شما نیاز به آزمایش دارید برای:

  • اعتبارسنجی داده های ورودی
  • اعتبارسنجی مهندسی ویژگی
  • تایید کیفیت نسخه های مدل جدید.
  • اعتبار سنجی زیرساخت های خدمات رسانی
  • تست یکپارچگی بین اجزای خط لوله