Exercício 1
Defina uma taxa de aprendizado de 0,03 no controle deslizante. Continue pressionando o botão ETAPA até que o algoritmo de gradiente descendente atinja o ponto mínimo da curva de perda. Quantos passos foram necessários?
Exercício 2
Você pode alcançar o mínimo mais rapidamente com uma taxa de aprendizado mais alta? Defina uma taxa de aprendizado de 0, 1 e continue pressionando Step até que o gradiente descendente atinja o mínimo. Quantos passos você completou desta vez?
Exercício 3
Que tal uma taxa de aprendizado ainda maior. Redefina o gráfico, defina uma taxa de aprendizado de 1 e tente alcançar o mínimo da curva de perda. O que aconteceu dessa vez?
Desafio opcional
Você pode encontrar a taxa de aprendizado de Goldilocks para essa curva, em que o gradiente descendente atinge o ponto mínimo no menor número de etapas? Qual é o menor número de etapas necessárias para alcançar o valor mínimo?