Zmniejszanie strat: optymalizacja współczynnika uczenia się

Ćwiczenie 1

Ustaw tempo uczenia się 0,03 na suwaku. Naciskaj przycisk KROK, aż algorytm gradientu spadnie do minimalnego punktu krzywej. Ile kroków udało Ci się zebrać?

Ćwiczenie 2

Czy możesz szybciej osiągnąć minimalne cele dzięki wyższym wskaźnikom nauczania? Ustaw szybkość uczenia się na 0,1 i powtarzaj tę czynność, aż spadek gradientu osiągnie minimalną wartość. Ile kroków zostało zrobionych tym razem?

Ćwiczenie 3

A może nawet jeszcze więcej? Zresetuj wykres, ustaw tempo uczenia się 1 i spróbuj osiągnąć minimalną krzywą. Co tym razem się stało?

Opcjonalne wyzwanie

Czy w przypadku tej krzywej współczynnik uczenia się Złotych jest taki, gdzie spadek gradientowy prowadzi do minimalnej liczby punktów w najmniejszej liczbie kroków? Minimalna liczba kroków wymagana do osiągnięcia minimalnej liczby kroków?