Reduzir perdas: como otimizar a taxa de aprendizado

Exercício 1

Defina uma taxa de aprendizado de 0,03 no controle deslizante. Continue pressionando o botão ETAPA até que o algoritmo de gradiente descendente atinja o ponto mínimo da curva de perda. Quantos passos foram necessários?

Exercício 2

Você pode alcançar o mínimo mais rapidamente com uma taxa de aprendizado mais alta? Defina uma taxa de aprendizado de 0, 1 e continue pressionando Step até que o gradiente descendente atinja o mínimo. Quantos passos você completou desta vez?

Exercício 3

Que tal uma taxa de aprendizado ainda maior. Redefina o gráfico, defina uma taxa de aprendizado de 1 e tente alcançar o mínimo da curva de perda. O que aconteceu dessa vez?

Desafio opcional

Você pode encontrar a taxa de aprendizado de Goldilocks para essa curva, em que o gradiente descendente atinge o ponto mínimo no menor número de etapas? Qual é o menor número de etapas necessárias para alcançar o valor mínimo?