Rừng quyết định

Rừng quyết định là một thuật ngữ chung để mô tả các mô hình được tạo từ nhiều cây quyết định. Dự đoán của rừng quyết định là tổng hợp các dự đoán của cây quyết định. Việc triển khai tính năng tổng hợp này phụ thuộc vào thuật toán dùng để huấn luyện rừng quyết định. Ví dụ: trong một rừng ngẫu nhiên phân loại nhiều lớp (một loại rừng quyết định), mỗi cây sẽ bỏ phiếu cho một lớp và dự đoán rừng ngẫu nhiên là lớp được đại diện nhiều nhất. Trong Cây tăng cường độ dốc (GBT) phân loại nhị phân (một loại rừng quyết định khác), mỗi cây sẽ xuất ra một logit (giá trị dấu phẩy động) và dự đoán cây tăng cường độ dốc là tổng của các giá trị đó, theo sau là một hàm kích hoạt (ví dụ: sigmoid).

Hai chương tiếp theo sẽ trình bày chi tiết về hai thuật toán rừng quyết định đó.