Tóm tắt khóa học

Dưới đây là phần tóm tắt ngắn gọn về những nội dung bạn đã học được trong khoá học:

  • Cây quyết định là một mô hình bao gồm một tập hợp các điều kiện được sắp xếp theo hệ phân cấp theo hình cây. Các điều kiện thuộc nhiều loại:
  • Quá trình huấn luyện cây quyết định bao gồm việc tìm kiếm điều kiện tốt nhất ở mỗi nút. Quy trình bộ tách sử dụng các chỉ số như đạt được thông tin hoặc Gini để xác định điều kiện tốt nhất.
  • Khu rừng quyết định là một chế độ được tạo từ nhiều cây quyết định. Dự đoán về rừng quyết định là tổng hợp các thông tin dự đoán của các cây quyết định.
  • Rừng ngẫu nhiên là một tập hợp các cây quyết định, trong đó mỗi cây quyết định được huấn luyện bằng một nhiễu ngẫu nhiên cụ thể.
  • Đóng gói là một kỹ thuật trong đó mỗi cây quyết định trong rừng ngẫu nhiên được huấn luyện dựa trên một tập hợp con các ví dụ khác nhau.
  • Các khu rừng ngẫu nhiên không cần tập dữ liệu xác thực. Thay vào đó, hầu hết các khu rừng ngẫu nhiên đều sử dụng kỹ thuật out-of-bag-evaluation để đánh giá chất lượng của mô hình.
  • Cây tăng cường độ (gradient) (quyết định) là một loại rừng quyết định được huấn luyện thông qua các hoạt động điều chỉnh lặp lại từ cây quyết định đầu vào. Giá trị có tên là shrinkage (độ rút gọn) kiểm soát tốc độ học của cây tăng cường chuyển màu (quyết định) và mức độ mà cây có thể tăng mức độ phù hợp.

 

Tài liệu tham khảo