اگر اولین باری که مدل خود را آموزش دادید، تمام منحنی های ضرر شما به این شکل باشد، یادگیری ماشین بسیار ساده تر خواهد بود:
شکل 20. منحنی تلفات ایده آل.
متأسفانه، تفسیر منحنی های ضرر اغلب چالش برانگیز است. از شهود خود در مورد منحنی های ضرر برای حل تمرین های این صفحه استفاده کنید.
تمرین 1: منحنی تلفات نوسانی
شکل 21. منحنی تلفات نوسانی.
برای بهبود منحنی ضرر نشان داده شده در شکل 21 چه سه کاری می توانید انجام دهید.
نرخ یادگیری را کاهش دهید.
بله، کاهش نرخ یادگیری اغلب هنگام رفع اشکال یک مشکل آموزشی ایده خوبی است.
نرخ یادگیری را افزایش دهید.
به طور کلی، زمانی که منحنی یادگیری یک مدل مشکلی را نشان می دهد، از افزایش نرخ یادگیری خودداری کنید.
تعداد نمونه های مجموعه آموزشی را افزایش دهید.
این یک ایده وسوسه انگیز است، اما بسیار بعید است که مشکل را حل کند.
مجموعه آموزشی را به تعداد کمی از نمونه های قابل اعتماد کاهش دهید.
اگرچه این تکنیک مصنوعی به نظر می رسد، اما در واقع ایده خوبی است. با فرض اینکه مدل بر روی مجموعه کوچکی از نمونه های قابل اعتماد همگرا می شود، سپس می توانید به تدریج مثال های بیشتری اضافه کنید، شاید کشف کنید که کدام مثال ها باعث نوسان منحنی ضرر می شوند.
داده های خود را در مقابل یک طرح داده بررسی کنید تا نمونه های بد را شناسایی کنید و سپس نمونه های بد را از مجموعه آموزشی حذف کنید.
بله، این یک تمرین خوب برای همه مدل ها است.
تمرین 2. منحنی باخت با یک پرش تند
شکل 22. افزایش شدید ضرر.
کدام دو مورد از عبارات زیر دلایل احتمالی تلفات انفجاری نشان داده شده در شکل 22 را مشخص می کند.
داده های ورودی حاوی مجموعه ای از مقادیر پرت است.
گاهی اوقات، به دلیل جابجایی نادرست دسته ها، یک دسته ممکن است دارای مقادیر پرت زیادی باشد.
نرخ منظم سازی خیلی زیاد است.
درست است، یک منظم سازی بسیار بالا می تواند از همگرایی یک مدل جلوگیری کند. با این حال، منحنی تلفات عجیب نشان داده شده در شکل 22 را ایجاد نمی کند.
داده های ورودی حاوی یک یا چند NaN هستند - برای مثال، مقداری که در اثر تقسیم بر صفر ایجاد می شود.
این شایع تر از چیزی است که شما انتظار دارید.
نرخ یادگیری بسیار پایین است.
نرخ یادگیری بسیار پایین ممکن است زمان تمرین را افزایش دهد، اما دلیل منحنی ضرر عجیب نیست.
تمرین 3. از دست دادن تست با از دست دادن تمرین متفاوت است
شکل 23. افزایش شدید از دست دادن اعتبار.
کدام یک از عبارات زیر دلیل این تفاوت بین منحنی های ضرر مجموعه های آموزشی و آزمایشی را به بهترین نحو مشخص می کند؟
نرخ یادگیری خیلی بالاست.
اگر نرخ یادگیری خیلی بالا بود، منحنی ضرر برای مجموعه آموزشی احتمالاً مانند آن رفتار نمی کرد.
مدل بیش از حد به مجموعه آموزشی تناسب دارد.
بله، احتمالاً همینطور است. راه حل های ممکن:
مدل را سادهتر کنید، احتمالاً با کاهش تعداد ویژگیها.
نرخ منظم سازی را افزایش دهید.
اطمینان حاصل کنید که مجموعه آموزشی و مجموعه تست از نظر آماری معادل هستند.
تمرین 4. منحنی ضرر گیر می کند
شکل 24. از دست دادن آشفته پس از تعداد معینی از مراحل.
کدام یک از عبارات زیر محتمل ترین توضیح برای منحنی زیان نامنظم نشان داده شده در شکل 24 است؟
مجموعه آموزشی دارای ویژگی های بسیار زیادی است.
بعید است که این دلیل باشد.
نرخ منظم سازی خیلی زیاد است.
بعید است که این دلیل باشد.
مجموعه آموزشی شامل توالی های تکراری از مثال ها است.
این یک احتمال است. مطمئن شوید که مثالها را بهاندازه کافی به هم میریزید.
تاریخ آخرین بهروزرسانی 2024-11-07 بهوقت ساعت هماهنگ جهانی.
[null,null,["تاریخ آخرین بهروزرسانی 2024-11-07 بهوقت ساعت هماهنگ جهانی."],[[["This document helps you understand and interpret Machine Learning loss curves through a series of exercises and visual examples."],["You will learn how to identify common issues like oscillating loss, exploding loss, overfitting, and erratic behavior in your models."],["Solutions are provided for each exercise, along with explanations for various loss curve patterns."],["Techniques to address these issues are discussed, including adjusting learning rate, cleaning training data, and applying regularization."],["A glossary of key Machine Learning terminology related to loss curves and model training is included for quick reference."]]],[]]