Trang này được dịch bởi Cloud Translation API.

Giảm thiểu tổn thất: Tỷ lệ học

Như đã lưu ý, vectơ chuyển màu có cả hướng và độ lớn. Thuật toán giảm độ dốc nhân với độ dốc với một đại lượng vô hướng được gọi là tốc độ học tập (đôi khi còn gọi là kích thước bước) để xác định điểm tiếp theo. Ví dụ: nếu cường độ chuyển màu là 2,5 và tốc độ học là 0,01, thì thuật toán giảm độ dốc sẽ chọn điểm tiếp theo cách điểm trước đó 0,025.

Hyperparameter là các nút điều chỉnh mà các lập trình viên điều chỉnh trong các thuật toán học máy. Hầu hết các lập trình viên máy học đều dành một khoảng thời gian tương đối để điều chỉnh tốc độ học. Nếu bạn chọn một tốc độ học quá nhỏ, quá trình học sẽ mất quá nhiều thời gian:

Vẫn là một đường cong hình chữ U. Rất nhiều điểm ở rất gần nhau và đường mòn của chúng đang khiến người chơi tiến xuống cuối bảng xếp hạng rất chậm.

Hình 6. Tốc độ học quá nhỏ.

Ngược lại, nếu bạn chỉ định tốc độ học quá lớn, thì điểm tiếp theo sẽ vĩnh viễn chuyển sang phần dưới cùng của giếng, giống như một thử nghiệm cơ học lượng tử đã gặp phải sai lầm nghiêm trọng:

Vẫn là một đường cong hình chữ U. Câu này chứa rất ít điểm. Dấu vết tích điểm nhảy ngay ngắn xuống cuối bảng xếp hạng rồi nhảy lại.

Hình 7. Tốc độ học quá lớn.

Mỗi bài toán hồi quy đều có tỷ lệ học là Goldilocks. Giá trị Goldilocks liên quan đến độ phẳng của hàm suy giảm. Nếu biết độ dốc của hàm suy giảm nhỏ thì bạn có thể yên tâm thử tốc độ học lớn hơn, bù cho độ dốc nhỏ và dẫn đến kích thước bước lớn hơn.

Vẫn là một đường cong hình chữ U. Hành trình tích điểm sẽ đạt đến điểm tối thiểu trong khoảng 8 bước.

Hình 8. Tốc độ học ở mức vừa phải.

Hãy nhấp vào biểu tượng dấu cộng để tìm hiểu thêm về tốc độ học lý tưởng.

Tốc độ học lý tưởng trong một phương diện là \(\frac{ 1 }{ f''(x) }\) (nghịch đảo của đạo hàm cấp hai của f(x) tại x).

Tốc độ học lý tưởng cho 2 chiều trở lên là nghịch đảo của Hessian (ma trận của các đạo hàm riêng phần cấp hai).

Câu chuyện về hàm lồi tổng quát phức tạp hơn.

Độ dốc của dốc

Tiếp

Tối ưu hoá tỷ lệ học tập