برازش بیش از حد: تفسیر منحنی های ضرر

اگر اولین باری که مدل خود را آموزش دادید، تمام منحنی های ضرر شما به این شکل باشد، یادگیری ماشین بسیار ساده تر خواهد بود:

شکل 20. نموداری که منحنی تلفات ایده آل را هنگام آموزش مدل یادگیری ماشین نشان می دهد. منحنی ضرر، افت را در محور y در برابر تعداد مراحل تمرین در محور x ترسیم می کند. با افزایش تعداد مراحل تمرین، ضرر شروع به مقدار زیاد می‌شود، سپس به صورت تصاعدی کاهش می‌یابد و در نهایت برای رسیدن به حداقل ضرر کاهش می‌یابد.
شکل 20. منحنی تلفات ایده آل.

متأسفانه، تفسیر منحنی های ضرر اغلب چالش برانگیز است. از شهود خود در مورد منحنی های ضرر برای حل تمرین های این صفحه استفاده کنید.

تمرین 1: منحنی تلفات نوسانی

شکل 21. یک منحنی ضرر (از دست دادن در محور y؛ تعداد مراحل تمرین در محور x) که در آن ضرر صاف نمی شود.             در عوض، ضرر به طور نامنظم در نوسان است.
شکل 21. منحنی تلفات نوسانی.
برای بهبود منحنی ضرر نشان داده شده در شکل 21 چه سه کاری می توانید انجام دهید.
نرخ یادگیری را کاهش دهید.
نرخ یادگیری را افزایش دهید.
تعداد نمونه های مجموعه آموزشی را افزایش دهید.
مجموعه آموزشی را به تعداد کمی از نمونه های قابل اعتماد کاهش دهید.
داده های خود را در مقابل یک طرح داده بررسی کنید تا نمونه های بد را شناسایی کنید و سپس نمونه های بد را از مجموعه آموزشی حذف کنید.

تمرین 2. منحنی باخت با یک پرش تند

شکل 22. نمودار منحنی تلفات که نشان می دهد افت تا تعداد معینی از مراحل آموزشی کاهش می یابد و سپس با گام های آموزشی بعدی به طور ناگهانی افزایش می یابد.
شکل 22. افزایش شدید ضرر.
کدام دو مورد از عبارات زیر دلایل احتمالی تلفات انفجاری نشان داده شده در شکل 22 را مشخص می کند.
داده های ورودی حاوی مجموعه ای از مقادیر پرت است.
نرخ منظم سازی خیلی زیاد است.
داده های ورودی حاوی یک یا چند NaN هستند - برای مثال، مقداری که در اثر تقسیم بر صفر ایجاد می شود.
نرخ یادگیری بسیار پایین است.

تمرین 3. از دست دادن تست با از دست دادن تمرین متفاوت است

شکل 23. به نظر می رسد منحنی از دست دادن تمرین همگرا می شود، اما افت اعتبار پس از تعداد معینی از مراحل آموزشی شروع به افزایش می کند.
شکل 23. افزایش شدید از دست دادن اعتبار.
کدام یک از عبارات زیر دلیل این تفاوت بین منحنی های ضرر مجموعه های آموزشی و آزمایشی را به بهترین نحو مشخص می کند؟
نرخ یادگیری خیلی بالاست.
مدل بیش از حد به مجموعه آموزشی تناسب دارد.

تمرین 4. منحنی ضرر گیر می کند

شکل 24. نمودار یک منحنی از دست دادن نشان می دهد که از دست دادن شروع به همگرا شدن با آموزش، اما سپس نمایش الگوهای تکراری که شبیه به یک موج مستطیل شکل است.
شکل 24. از دست دادن آشفته پس از تعداد معینی از مراحل.
کدام یک از عبارات زیر محتمل ترین توضیح برای منحنی زیان نامنظم نشان داده شده در شکل 24 است؟
مجموعه آموزشی دارای ویژگی های بسیار زیادی است.
نرخ منظم سازی خیلی زیاد است.
مجموعه آموزشی شامل توالی های تکراری از مثال ها است.