تولید سیستم های ML: دانش خود را آزمایش کنید

شما از یادگیری ماشینی برای ساخت یک مدل طبقه بندی استفاده می کنید که ظاهر تکشاخ را پیش بینی می کند. مجموعه داده شما 10000 ظاهر تکشاخ و 10000 تکشاخ غیر ظاهری را نشان می دهد. مجموعه داده شامل مکان، زمان روز، ارتفاع، دما، رطوبت، پوشش درخت، وجود رنگین کمان و چندین ویژگی دیگر است.

پس از راه‌اندازی پیش‌بینی‌کننده ظاهر تکشاخ، باید با آموزش مجدد داده‌های جدید، مدل خود را تازه نگه دارید. از آنجایی که شما در حال جمع‌آوری داده‌های جدید بیش از حد برای آموزش هستید، تصمیم می‌گیرید با نمونه‌برداری از داده‌های جدید در یک بازه زمانی، داده‌های آموزشی را محدود کنید. شما همچنین باید الگوهای روزانه و سالانه را در ظاهر اسب شاخدار در نظر بگیرید. چه پنجره زمانی را انتخاب می کنید؟

یک روز، زیرا یک پنجره بزرگتر منجر به داده های زیادی می شود و آموزش مدل شما خیلی طول می کشد.

یک هفته، به طوری که مجموعه داده شما خیلی بزرگ نباشد اما همچنان بتوانید الگوها را صاف کنید.

یک سال، برای اطمینان از اینکه مدل شما با الگوهای سالانه مغرضانه نیست.

انحراف آموزش-سرویس: قالب داده های ارائه به تدریج پس از شروع ارائه مدل تغییر کرد.

شما در طول تمرین از دقت به عنوان معیار استفاده کردید.

مدلت کهنه شده

هیچ کدام از موارد بالا.

شما نمونه های آموزشی کافی برای قطب جنوب نداشتید.

شما به جای آموزش استاتیک از آموزش پویا استفاده کردید.

مدلت کهنه شده

همه موارد بالا.

کیفیت بالای پیش‌بینی‌های شما باعث می‌شود کاربران به راحتی تک‌شاخ‌ها را بیابند و بر رفتار ظاهری تک‌شاخ تأثیر می‌گذارند.

مدل سازی مناطق شهری دشوار است.

ظاهر تکشاخ چندین بار در مناطق پرجمعیت گزارش می‌شود که داده‌های تمرینی شما را تغییر می‌دهد.

مدل را از آموزش پویا به آموزش استاتیک تغییر دهید.

مدل را از استنتاج پویا به استنتاج استاتیک تغییر دهید.

قبل از سرو کیفیت مدل را تأیید کنید.

هیچ یک از راه حل های بالا کمک نمی کند.