減少損失:最佳化學習率

運動 1

將滑桿中的學習率設為 0.03。持續按 STEP 按鈕,直到梯度下降演算法達到損失曲線的最小點。需要多少步?

運動 2

提高學習率可以更快達到最低限度嗎?將學習率設為 0.1,並持續按 STEP,直到梯度下降到最小為止。這次需要多少步?

運動 3

學習速度更勝以往重設圖形,將學習率設為 1,嘗試達到損失曲線的最小值。這次發生什麼事?

自選挑戰

你能找到這個曲線的 Goldilocks 學習率,其中梯度下降表示在最少的步驟中到達最低點了嗎?達到最低步數的必要步驟為何?