تولید سیستم های ML: دانش خود را آزمایش کنید

  1. شما از یادگیری ماشینی برای ساخت یک مدل طبقه بندی استفاده می کنید که ظاهر تکشاخ را پیش بینی می کند. مجموعه داده شما 10000 ظاهر تکشاخ و 10000 تکشاخ غیر ظاهری را نشان می دهد. مجموعه داده شامل مکان، زمان روز، ارتفاع، دما، رطوبت، پوشش درخت، وجود رنگین کمان و چندین ویژگی دیگر است.

    پس از راه‌اندازی پیش‌بینی‌کننده ظاهر تکشاخ، باید با آموزش مجدد داده‌های جدید، مدل خود را تازه نگه دارید. از آنجایی که شما در حال جمع‌آوری داده‌های جدید بیش از حد برای آموزش هستید، تصمیم می‌گیرید با نمونه‌برداری از داده‌های جدید در یک بازه زمانی، داده‌های آموزشی را محدود کنید. شما همچنین باید الگوهای روزانه و سالانه را در ظاهر اسب شاخدار در نظر بگیرید. چه پنجره زمانی را انتخاب می کنید؟

  2. شما پیش بینی کننده ظاهر تکشاخ خود را راه اندازی می کنید. خوب کار می کند! شما به تعطیلات می روید و بعد از سه هفته برمی گردید و متوجه می شوید که کیفیت مدل شما به میزان قابل توجهی کاهش یافته است. فرض کنید رفتار اسب شاخدار بعید است در سه هفته تغییر قابل توجهی داشته باشد. محتمل ترین توضیح برای کاهش کیفیت چیست؟

  3. شما پیش‌بینی‌های مدل برای قطب جنوب را مرور می‌کنید و متوجه می‌شوید که از زمان عرضه مدل به تولید، این مدل پیش‌بینی‌های ضعیفی در آنجا انجام داده است. کدام یک از موارد زیر می تواند منشا مشکل باشد؟

  4. پیش بینی کننده ظاهر تکشاخ شما یک سال است که عمل کرده است. شما بسیاری از مشکلات را برطرف کرده اید، و کیفیت در حال حاضر بالا است. با این حال، متوجه یک مشکل کوچک اما دائمی می شوید. کیفیت مدل شما در مناطق شهری کمی پایین‌تر رفته است. علتش چی میتونه باشه؟

  5. با تمام عیب‌یابی‌های خود، کیفیت پیش‌بینی‌های مدل یونیکورن را تا حد زیادی بهبود بخشیده‌اید و در نتیجه، استفاده از آن ده برابر شده است. با این حال، کاربران اکنون شکایت دارند که این مدل بسیار کند است. درخواست‌های استنتاج معمولاً بیش از 30 ثانیه طول می‌کشد تا پیش‌بینی‌ها را برگردانند. کدام یک از تغییرات زیر می تواند به حل این مشکل کمک کند؟