برازش بیش از حد: تفسیر منحنی های ضرر

اگر اولین باری که مدل خود را آموزش دادید، تمام منحنی های ضرر شما به این شکل باشد، یادگیری ماشین بسیار ساده تر خواهد بود:

شکل 20. نموداری که منحنی تلفات ایده آل را هنگام آموزش مدل یادگیری ماشین نشان می دهد. منحنی ضرر، افت را در محور y در برابر تعداد مراحل تمرین در محور x ترسیم می کند. با افزایش تعداد مراحل تمرین، ضرر شروع به مقدار زیاد می‌شود، سپس به صورت تصاعدی کاهش می‌یابد و در نهایت برای رسیدن به حداقل ضرر کاهش می‌یابد.
شکل 20. منحنی تلفات ایده آل.

متأسفانه، تفسیر منحنی های ضرر اغلب چالش برانگیز است. از شهود خود در مورد منحنی های ضرر برای حل تمرین های این صفحه استفاده کنید.

تمرین 1: منحنی تلفات نوسانی

شکل 21. یک منحنی ضرر (از دست دادن در محور y؛ تعداد مراحل تمرین در محور x) که در آن ضرر صاف نمی شود.             در عوض، ضرر به طور نامنظم در نوسان است.
شکل 21. منحنی تلفات نوسانی.
برای بهبود منحنی ضرر نشان داده شده در شکل 21 چه سه کاری می توانید انجام دهید.
داده های خود را در مقابل یک طرح داده بررسی کنید تا نمونه های بد را شناسایی کنید و سپس نمونه های بد را از مجموعه آموزشی حذف کنید.
بله، این یک تمرین خوب برای همه مدل ها است.
نرخ یادگیری را کاهش دهید.
بله، کاهش نرخ یادگیری اغلب هنگام رفع اشکال یک مشکل آموزشی ایده خوبی است.
مجموعه آموزشی را به تعداد کمی از نمونه های قابل اعتماد کاهش دهید.
اگرچه این تکنیک مصنوعی به نظر می رسد، اما در واقع ایده خوبی است. با فرض اینکه مدل بر روی مجموعه کوچکی از نمونه های قابل اعتماد همگرا می شود، سپس می توانید به تدریج مثال های بیشتری اضافه کنید، شاید کشف کنید که کدام مثال ها باعث نوسان منحنی ضرر می شوند.
تعداد نمونه های مجموعه آموزشی را افزایش دهید.
این یک ایده وسوسه انگیز است، اما بسیار بعید است که مشکل را حل کند.
نرخ یادگیری را افزایش دهید.
به طور کلی، زمانی که منحنی یادگیری یک مدل مشکلی را نشان می دهد، از افزایش نرخ یادگیری خودداری کنید.

تمرین 2. منحنی باخت با یک پرش تند

شکل 22. نمودار منحنی تلفات که نشان می دهد افت تا تعداد معینی از مراحل آموزشی کاهش می یابد و سپس با گام های آموزشی بعدی به طور ناگهانی افزایش می یابد.
شکل 22. افزایش شدید ضرر.
کدام دو مورد از عبارات زیر دلایل احتمالی تلفات انفجاری نشان داده شده در شکل 22 را مشخص می کند.
داده های ورودی حاوی یک یا چند NaN هستند - برای مثال، مقداری که در اثر تقسیم بر صفر ایجاد می شود.
این شایع تر از چیزی است که شما انتظار دارید.
داده های ورودی حاوی مجموعه ای از مقادیر پرت است.
گاهی اوقات، به دلیل جابجایی نادرست دسته ها، یک دسته ممکن است دارای مقادیر پرت زیادی باشد.
نرخ یادگیری بسیار پایین است.
نرخ یادگیری بسیار پایین ممکن است زمان تمرین را افزایش دهد، اما دلیل منحنی ضرر عجیب نیست.
نرخ منظم سازی خیلی زیاد است.
درست است، یک منظم سازی بسیار بالا می تواند از همگرایی یک مدل جلوگیری کند. با این حال، منحنی تلفات عجیب نشان داده شده در شکل 22 را ایجاد نمی کند.

تمرین 3. از دست دادن تست با از دست دادن تمرین متفاوت است

شکل 23. به نظر می رسد منحنی از دست دادن تمرین همگرا می شود، اما افت اعتبار پس از تعداد معینی از مراحل آموزشی شروع به افزایش می کند.
شکل 23. افزایش شدید از دست دادن اعتبار.
کدام یک از عبارات زیر دلیل این تفاوت بین منحنی های ضرر مجموعه های آموزشی و آزمایشی را به بهترین نحو مشخص می کند؟
مدل بیش از حد به مجموعه آموزشی تناسب دارد.
بله، احتمالاً همینطور است. راه حل های ممکن:
  • مدل را ساده‌تر کنید، احتمالاً با کاهش تعداد ویژگی‌ها.
  • نرخ منظم سازی را افزایش دهید.
  • اطمینان حاصل کنید که مجموعه آموزشی و مجموعه تست از نظر آماری معادل هستند.
نرخ یادگیری خیلی بالاست.
اگر نرخ یادگیری خیلی بالا بود، منحنی ضرر برای مجموعه آموزشی احتمالاً مانند آن رفتار نمی کرد.

تمرین 4. منحنی ضرر گیر می کند

شکل 24. نمودار یک منحنی از دست دادن نشان می دهد که از دست دادن شروع به همگرا شدن با آموزش، اما سپس نمایش الگوهای تکراری که شبیه به یک موج مستطیل شکل است.
شکل 24. از دست دادن آشفته پس از تعداد معینی از مراحل.
کدام یک از عبارات زیر محتمل ترین توضیح برای منحنی زیان نامنظم نشان داده شده در شکل 24 است؟
مجموعه آموزشی شامل توالی های تکراری از مثال ها است.
این یک احتمال است. مطمئن شوید که مثال‌ها را به‌اندازه کافی به هم می‌ریزید.
نرخ منظم سازی خیلی زیاد است.
بعید است که این دلیل باشد.
مجموعه آموزشی دارای ویژگی های بسیار زیادی است.
بعید است که این دلیل باشد.