Trong các vấn đề hồi quy, bạn nên xác định lỗi đã ký là sự khác biệt giữa giá trị dự đoán và nhãn. Tuy nhiên, trong các loại vấn đề khác, chiến lược này thường dẫn đến kết quả không tốt. Một chiến lược hiệu quả hơn được sử dụng trong phương pháp tăng cường độ dốc là:
- Xác định một hàm tổn thất tương tự như các hàm tổn thất được sử dụng trong mạng nơron. Ví dụ: entropy (còn gọi là tổn thất logarit) cho một vấn đề phân loại.
- Huấn luyện mô hình yếu để dự đoán độ dốc của tổn thất theo đầu ra của mô hình mạnh.
Theo cách chính thức, với một hàm mất mát $L(y,p)$ trong đó $y$ là nhãn và $p$ là dự đoán, phản hồi giả $z_i$ dùng để huấn luyện mô hình yếu ở bước $i$ là:
trong đó:
- $F_i$ là kết quả dự đoán của mô hình mạnh.
Ví dụ trước là một vấn đề hồi quy: Mục tiêu là dự đoán một giá trị số. Trong trường hợp hồi quy, lỗi bình phương là một hàm tổn thất phổ biến:
Trong trường hợp này, độ dốc là:
Nói cách khác, độ dốc là lỗi đã ký từ ví dụ của chúng ta với hệ số là 2. Xin lưu ý rằng các hệ số không đổi không quan trọng do sự co rút. Lưu ý rằng sự tương đương này chỉ đúng đối với các vấn đề hồi quy có tổn thất lỗi bình phương. Đối với các vấn đề học có giám sát khác (ví dụ: phân loại, xếp hạng, hồi quy với tổn thất theo tỷ lệ phần trăm), không có sự tương đương giữa độ dốc và lỗi đã ký.
Tối ưu hoá lá và cấu trúc bằng bước phương pháp Newton
Phương pháp Newton là một phương pháp tối ưu hoá như phương pháp hạ gradient. Tuy nhiên, không giống như phương pháp hạ gradient chỉ sử dụng độ dốc của hàm để tối ưu hoá, phương pháp Newton sử dụng cả độ dốc (đạo hàm đầu tiên) và đạo hàm thứ hai của hàm để tối ưu hoá.
Một bước của phương pháp giảm độ dốc như sau:
và phương pháp Newton như sau:
Bạn có thể tích hợp phương pháp Newton vào quá trình huấn luyện cây tăng cường theo độ dốc theo hai cách:
- Sau khi một cây được huấn luyện, một bước của Newton sẽ được áp dụng trên mỗi lá và ghi đè giá trị của lá đó. Cấu trúc cây không bị ảnh hưởng; chỉ các giá trị lá mới thay đổi.
- Trong quá trình phát triển của cây, các điều kiện được chọn theo điểm số bao gồm một thành phần của công thức Newton. Cấu trúc của cây sẽ bị ảnh hưởng.
- YDF luôn áp dụng bước Newton trên lá (tuỳ chọn 1).
- Bạn có thể bật tuỳ chọn 2 bằng
use_hessian_gain=True
.