رگرسیون خطی: تمرین نزولی گرادیان

در این تمرین، نمودار داده‌های بهره‌وری سوخت از تمرین پارامترها را مجدداً مشاهده خواهید کرد. اما این بار، از شیب نزول برای یادگیری وزن بهینه و مقادیر بایاس برای یک مدل خطی استفاده خواهید کرد که تلفات را به حداقل می رساند.

سه کار زیر نمودار را کامل کنید.

وظیفه شماره 1: لغزنده نرخ یادگیری را در زیر نمودار تنظیم کنید تا نرخ یادگیری 0.03 تنظیم شود. برای اجرای gradient descent روی دکمه Start کلیک کنید.

چه مدت طول می کشد تا آموزش مدل همگرا شود (به حداقل مقدار تلفات پایدار برسد)؟ مقدار MSE در همگرایی مدل چقدر است؟ چه وزن و ارزش سوگیری این مقدار را ایجاد می کند؟

وقتی نرخ یادگیری را 0.03 تنظیم کردیم، مدل پس از تقریباً 30 ثانیه همگرا شد و به MSE کمی کمتر از 3 با مقادیر وزن و بایاس به ترتیب -2.08 و 23.098 رسید. این نشان می دهد که ما مقدار نرخ یادگیری خوبی را انتخاب کرده ایم.

وظیفه شماره 2: برای تنظیم مجدد مقادیر Weight و Bias در نمودار، روی دکمه Reset در زیر نمودار کلیک کنید. لغزنده نرخ یادگیری را روی مقداری در حدود 1.10e -5 تنظیم کنید. برای اجرای gradient descent روی دکمه Start کلیک کنید.

در مورد اینکه چقدر طول می کشد تا آموزش مدل این بار همگرا شود، چه چیزی را متوجه می شوید؟

پس از چند دقیقه، آموزش مدل هنوز همگرا نشده است. به‌روزرسانی‌های کوچک مقادیر Weight و Bias همچنان منجر به کاهش کمی کاهش می‌شوند. این نشان می‌دهد که انتخاب نرخ یادگیری بالاتر، نزول گرادیان را قادر می‌سازد تا وزن بهینه و مقادیر سوگیری را سریع‌تر پیدا کند.

وظیفه شماره 3: برای تنظیم مجدد مقادیر Weight و Bias در نمودار، روی دکمه Reset در زیر نمودار کلیک کنید. لغزنده نرخ یادگیری را تا 1 تنظیم کنید. برای اجرای گرادیان نزول، روی دکمه Start کلیک کنید.

با اجرای گرادیان نزول چه اتفاقی برای مقادیر تلفات می افتد؟ این بار آموزش مدل چقدر طول می کشد تا همگرا شود؟

مقادیر زیان به شدت در مقادیر بالا (MSE بیش از 300) در نوسان است. این نشان می دهد که نرخ یادگیری بسیار بالا است و آموزش مدل هرگز به همگرایی نمی رسد.