Kaybı Azaltma: Gradyan İniş

Yinelemeli yaklaşım diyagramında (Şekil 1) "İşlem parametresi güncellemeleri" başlıklı yeşil bir el dalgalı kutu vardı. Şimdi bu algoritmaya dayalı peri tozunu daha önemli bir şeyle değiştireceğiz.

Tüm olası \(w_1\)değerleri için kaybı hesaplamak üzere zamana ve bilgi işlem kaynaklarımıza sahip olduğumuzu varsayalım. İncelediğimiz regresyon problemleri için, sonuçta ortaya çıkan kayıp grafiği \(w_1\) her zaman dışbükey olacaktır. Diğer bir deyişle, olay örgüsü her zaman şöyle bir kase şeklinde olacaktır:

Dikey eksen "kayıp", yatay ekseni ise ağırlık değeri olarak etiketlenmiş U şekilli bir eğrinin grafiği.

Şekil 2. Regresyon problemlerinde, ağırlık grafiklerine kıyasla dışbükey kayıp ortaya çıkar.

 

Dışbükey problemlerde yalnızca bir minimum değer vardır. Diğer bir deyişle, eğimin tam olarak 0 olduğu tek bir yer vardır. Bu minimum değer, kayıp fonksiyonunun kesiştiği yerdir.

Tüm veri kümesi genelinde düşünülebilir her \(w_1\)değeri için kayıp fonksiyonunu hesaplamak, yakınsaklık noktasını bulmak için verimsiz bir yol olur. Renk geçişi iniş adı verilen daha iyi bir mekanizmayı (makine öğreniminde çok popüler) inceleyelim.

Gradyan düşüşün ilk aşaması \(w_1\)için bir başlangıç değeri (başlangıç noktası) seçmektir. Başlangıç noktası çok önemli değildir. Bu nedenle birçok algoritma \(w_1\) 0'a ayarlanır veya rastgele bir değer seçer. Aşağıdaki şekilde, 0'dan biraz daha büyük bir başlangıç noktası seçtiğimiz gösterilmektedir:

U şekilli bir eğrinin grafiği. Eğrinin sol tarafının yaklaşık yarısı kadar olan bir nokta "Başlangıç Noktası" olarak etiketlenir.

3. Şekil. Gradyan iniş için başlangıç noktası.

Daha sonra gradyan iniş algoritması, başlangıç noktasında kayıp eğrisinin gradyanını hesaplar. Burada, Şekil 3'te, kaybın gradyanı, eğrinin türevine (eğimi) eşittir ve size hangi yolun "daha sıcak" veya "daha soğuk" olduğunu bildirir. Birden fazla ağırlık olduğunda gradyan, ağırlıklara göre kısmi türevlerin bir vektörüdür.

Renk geçişinin bir vektör olduğunu, bu nedenle aşağıdaki özelliklerin her ikisine de sahip olduğunu unutmayın:

  • yol tarifi
  • büyüklük

Renk geçişi, her zaman kayıp işlevindeki en dik artış yönünü gösterir. Gradyan iniş algoritması, kaybı mümkün olduğunca hızlı bir şekilde azaltmak için negatif renk geçişinin yönünde bir adım atar.

U şekilli bir eğrinin grafiği. Eğrinin sol tarafındaki bir nokta "Başlangıç Noktası" olarak etiketlenir. "Negatif gradyan" etiketli bir ok, bu noktadan sağa işaret ediyor.

4. Şekil. Gradyan iniş, negatif renk geçişlerini temel alır.

Kayıp işlevi eğrisi boyunca bir sonraki noktayı belirlemek için gradyan iniş algoritması, aşağıdaki şekilde gösterildiği gibi başlangıç noktasına gradyanın büyüklüğünün bir kısmını ekler:

U şekilli bir eğrinin grafiği. Eğrinin sol tarafındaki bir nokta "Başlangıç Noktası" olarak etiketlenir. "Negatif gradyan" etiketli bir ok, bu noktadan sağa işaret ediyor. Başka bir ok da ilk okun ucundan eğri üzerindeki ikinci bir noktaya işaret ediyor. İkinci nokta "sonraki nokta" olarak etiketlenir.

5. Şekil. Bir gradyan adımı, bizi kayıp eğrisinde bir sonraki noktaya taşıyor.

Daha sonra gradyan inişi, daha sonra bu işlemi tekrarlayarak minimum değere daha da yaklaşır.