اگر اولین باری که مدل خود را آموزش دادید، تمام منحنی های ضرر شما به این شکل باشد، یادگیری ماشین بسیار ساده تر خواهد بود:
متأسفانه، تفسیر منحنی های ضرر اغلب چالش برانگیز است. از شهود خود در مورد منحنی های ضرر برای حل تمرین های این صفحه استفاده کنید.
تمرین 1: منحنی تلفات نوسانی
برای بهبود منحنی ضرر نشان داده شده در شکل 21 چه سه کاری می توانید انجام دهید.
داده های خود را در مقابل یک طرح داده بررسی کنید تا نمونه های بد را شناسایی کنید و سپس نمونه های بد را از مجموعه آموزشی حذف کنید.
بله، این یک تمرین خوب برای همه مدل ها است.
نرخ یادگیری را کاهش دهید.
بله، کاهش نرخ یادگیری اغلب هنگام رفع اشکال یک مشکل آموزشی ایده خوبی است.
مجموعه آموزشی را به تعداد کمی از نمونه های قابل اعتماد کاهش دهید.
اگرچه این تکنیک مصنوعی به نظر می رسد، اما در واقع ایده خوبی است. با فرض اینکه مدل بر روی مجموعه کوچکی از نمونه های قابل اعتماد همگرا می شود، سپس می توانید به تدریج مثال های بیشتری اضافه کنید، شاید کشف کنید که کدام مثال ها باعث نوسان منحنی ضرر می شوند.
تعداد نمونه های مجموعه آموزشی را افزایش دهید.
این یک ایده وسوسه انگیز است، اما بسیار بعید است که مشکل را حل کند.
نرخ یادگیری را افزایش دهید.
به طور کلی، زمانی که منحنی یادگیری یک مدل مشکلی را نشان می دهد، از افزایش نرخ یادگیری خودداری کنید.
تمرین 2. منحنی باخت با یک پرش تند
کدام دو مورد از عبارات زیر دلایل احتمالی تلفات انفجاری نشان داده شده در شکل 22 را مشخص می کند.
داده های ورودی حاوی یک یا چند NaN هستند - برای مثال، مقداری که در اثر تقسیم بر صفر ایجاد می شود.
این شایع تر از چیزی است که شما انتظار دارید.
داده های ورودی حاوی مجموعه ای از مقادیر پرت است.
گاهی اوقات، به دلیل جابجایی نادرست دسته ها، یک دسته ممکن است دارای مقادیر پرت زیادی باشد.
نرخ یادگیری بسیار پایین است.
نرخ یادگیری بسیار پایین ممکن است زمان تمرین را افزایش دهد، اما دلیل منحنی ضرر عجیب نیست.
نرخ منظم سازی خیلی زیاد است.
درست است، یک منظم سازی بسیار بالا می تواند از همگرایی یک مدل جلوگیری کند. با این حال، منحنی تلفات عجیب نشان داده شده در شکل 22 را ایجاد نمی کند.
تمرین 3. از دست دادن تست با از دست دادن تمرین متفاوت است
کدام یک از عبارات زیر دلیل این تفاوت بین منحنی های ضرر مجموعه های آموزشی و آزمایشی را به بهترین نحو مشخص می کند؟
مدل بیش از حد به مجموعه آموزشی تناسب دارد.
بله، احتمالاً همینطور است. راه حل های ممکن:
- مدل را سادهتر کنید، احتمالاً با کاهش تعداد ویژگیها.
- نرخ منظم سازی را افزایش دهید.
- اطمینان حاصل کنید که مجموعه آموزشی و مجموعه تست از نظر آماری معادل هستند.
نرخ یادگیری خیلی بالاست.
اگر نرخ یادگیری خیلی بالا بود، منحنی ضرر برای مجموعه آموزشی احتمالاً مانند آن رفتار نمی کرد.
تمرین 4. منحنی ضرر گیر می کند
کدام یک از عبارات زیر محتمل ترین توضیح برای منحنی زیان نامنظم نشان داده شده در شکل 24 است؟
مجموعه آموزشی شامل توالی های تکراری از مثال ها است.
این یک احتمال است. مطمئن شوید که مثالها را بهاندازه کافی به هم میریزید.
نرخ منظم سازی خیلی زیاد است.
بعید است که این دلیل باشد.
مجموعه آموزشی دارای ویژگی های بسیار زیادی است.
بعید است که این دلیل باشد.