Giảm tổn thất: Dốc dốc

Sơ đồ phương pháp lặp lại (Hình 1) có một hộp gợn sóng tay màu xanh lục có tiêu đề "Tính toán bản cập nhật thông số". Giờ chúng tôi sẽ thay thế bụi thần tiên thuật toán đó bằng một thứ gì đó quan trọng hơn.

Giả sử chúng ta có thời gian và tài nguyên điện toán để tính toán tổn thất cho tất cả các giá trị có thể có của \(w_1\). Đối với loại bài toán hồi quy mà chúng tôi đã kiểm tra, biểu đồ thua lỗ so với \(w_1\) sẽ luôn là dạng lồi. Nói cách khác, cốt truyện sẽ luôn có dạng bát, tương tự như sau:

Biểu đồ một đường cong hình chữ U, với trục tung được gắn nhãn 'giảm' và trục ngang được gắn nhãn giá trị của trọng số w i.

Hình 2. Bài toán hồi quy dẫn đến sự sụt giảm lồi so với biểu đồ trọng lượng.

 

Các bài toán lồi chỉ có một giá trị tối thiểu; tức là chỉ có một vị trí có hệ số góc chính xác bằng 0. Mức tối thiểu đó là nơi hàm mất hội tụ.

Việc tính toán hàm tổn thất cho mọi giá trị có thể hình dung của \(w_1\)trên toàn bộ tập dữ liệu sẽ là cách không hiệu quả để tìm điểm hội tụ. Hãy tìm hiểu một cơ chế tốt hơn (rất phổ biến trong công nghệ học máy) có tên là giảm độ chuyển màu (gradient).

Giai đoạn đầu tiên của quá trình giảm độ dốc là chọn một giá trị bắt đầu (điểm bắt đầu) cho \(w_1\). Điểm xuất phát không quan trọng nhiều; do đó, nhiều thuật toán chỉ đặt \(w_1\) thành 0 hoặc chọn một giá trị ngẫu nhiên. Hình sau đây cho thấy chúng tôi đã chọn điểm bắt đầu lớn hơn 0 một chút:

Biểu đồ một đường cong hình chữ U. Một điểm nằm ở khoảng giữa phía bên trái của đường cong được gắn nhãn 'Điểm bắt đầu'.

Hình 3. Điểm xuất phát của phương pháp giảm độ dốc.

Sau đó, thuật toán giảm độ dốc sẽ tính toán độ dốc của đường cong mất dữ liệu tại điểm bắt đầu. Ở Hình 3, độ dốc của tổn thất tương đương với dẫn xuất (độ dốc) của đường cong và cho bạn biết hướng nào "ấm" hơn hay "đậm hơn". Khi có nhiều trọng số, gradient là vectơ của các đạo hàm riêng tính theo trọng số.

Lưu ý rằng vectơ chuyển màu là một vectơ, vì vậy, vectơ này có cả hai đặc điểm sau:

  • một hướng
  • độ lớn

Độ dốc luôn trỏ theo hướng tăng mạnh nhất trong hàm mất. Thuật toán giảm độ dốc sẽ thực hiện một bước theo hướng chuyển màu âm nhằm giảm tình trạng mất màu nhanh nhất có thể.

Biểu đồ một đường cong hình chữ U. Một điểm ở phía bên trái của đường cong được gắn nhãn 'Điểm bắt đầu'. Một mũi tên có nhãn 'gradient âm' trỏ từ điểm này sang bên phải.

Hình 4. Tính năng giảm chuyển màu phụ thuộc vào màu chuyển tiếp âm.

Để xác định điểm tiếp theo trên đường cong của hàm mất màu, thuật toán giảm độ dốc sẽ thêm một phần độ lớn của độ dốc vào điểm bắt đầu như minh hoạ trong hình sau đây:

Biểu đồ một đường cong hình chữ U. Một điểm ở phía bên trái của đường cong được gắn nhãn 'Điểm bắt đầu'. Một mũi tên có nhãn 'gradient âm' trỏ từ điểm này sang bên phải. Một mũi tên khác chỉ từ đầu mũi tên đầu tiên xuống điểm thứ hai trên đường cong. Điểm thứ hai được gắn nhãn 'điểm tiếp theo'.

Hình 5. Một bước chuyển màu sẽ đưa chúng ta đến điểm tiếp theo trên đường cong tổn thất.

Sau đó, quá trình giảm độ dốc sẽ lặp lại quá trình này, bao giờ gần mức tối thiểu.