Bu alıştırmada, Parametreler alıştırmasında yer alan yakıt verimliliği verilerinin grafiğini tekrar ziyaret edeceksiniz. Ancak bu kez, kaybı en aza indiren doğrusal bir model için en uygun ağırlık ve önyargı değerlerini öğrenmek üzere gradyan azalma yöntemini kullanacaksınız.
Grafiğin altındaki üç görevi tamamlayın.
1.görev: 0,03 öğrenme hızı ayarlamak için grafiğin altındaki Öğrenme Hızı kaydırma çubuğunu ayarlayın. Eğim azalma yöntemini çalıştırmak için Başlat düğmesini tıklayın.
Model eğitiminin yakınsaması (sabit bir minimum kayıp değerine ulaşması) ne kadar sürer? Model yakınsaklığındaki MSE değeri nedir? Bu değeri hangi ağırlık ve önyargı değerleri oluşturur?
Çözümümüzü görmek için artı simgesini tıklayın
0,03 öğrenme hızını belirlediğimizde model, yaklaşık 30 saniye sonra tümleşti. Ağırlık ve sapma değerleri sırasıyla -2,08 ve 23,098 olmak üzere, 3'ün biraz altında bir MSE'ye ulaştı. Bu, iyi bir öğrenme hızı değeri seçtiğimizi gösterir.
2. görev: Grafiğin altındaki Sıfırla düğmesini tıklayarak grafikteki Ağırlık ve Önyargı değerlerini sıfırlayın. Öğrenme Hızı kaydırma çubuğunu 1,10e–5 civarında bir değere ayarlayın. Eğim azalma yöntemini çalıştırmak için Başlat düğmesini tıklayın.
Bu sefer model eğitiminin yakınsaması ne kadar sürdü?
Çözümü görmek için artı simgesini tıklayın
Birkaç dakika geçmesine rağmen model eğitimi hâlâ yakınlaşmadı. Ağırlık ve önyargı değerlerinde yapılan küçük güncellemeler, kayıp değerlerinin biraz daha düşük olmasına neden olmaya devam ediyor. Bu, daha yüksek bir öğrenme hızı seçmenin gradyan azalma yönteminin optimal ağırlık ve önyargı değerlerini daha hızlı bulmasını sağlayacağını gösterir.
3. görev: Grafikteki ağırlık ve önyargı değerlerini sıfırlamak için grafiğin altındaki Sıfırla düğmesini tıklayın. Öğrenme Hızı kaydırma çubuğunu 1'e kadar ayarlayın. Eğim azalma yöntemini çalıştırmak için Başlat düğmesini tıklayın.
Gradyan azalma çalışırken kayıp değerlerine ne olur? Bu sefer model eğitiminin birleşmesi ne kadar sürer?
Çözümü görmek için artı simgesini tıklayın
Kayıp değerleri, yüksek değerlerde (300'ün üzerindeki MSE) büyük dalgalanmalar gösterir. Bu, öğrenme hızının çok yüksek olduğunu ve model eğitiminin hiçbir zaman yakınsamaya ulaşmayacağını gösterir.