Nhiều mức độ quan trọng
Mức độ quan trọng của biến (còn gọi là mức độ quan trọng của tính năng) là điểm số cho biết mức độ "quan trọng" của một tính năng đối với mô hình. Ví dụ: nếu đối với một mô hình cụ thể có hai tính năng đầu vào "f1" và "f2", mức độ quan trọng của biến là {f1=5.8, f2=2.5}, thì tính năng "f1" sẽ "quan trọng" hơn đối với mô hình so với tính năng "f2". Tương tự như với các mô hình học máy khác, tầm quan trọng của biến là một cách đơn giản để hiểu được cách hoạt động của cây quyết định.
Bạn có thể áp dụng mức độ quan trọng của biến không phụ thuộc vào mô hình, chẳng hạn như mức độ quan trọng của biến hoán vị cho cây quyết định.
Cây quyết định cũng có tầm quan trọng biến đổi cụ thể, chẳng hạn như:
- Tổng điểm phân tách với một biến cho trước.
- Số nút có một biến cho trước.
- Độ sâu trung bình xuất hiện lần đầu một đối tượng trên tất cả các đường dẫn cây.
Mức độ quan trọng của mỗi biến có thể khác nhau tuỳ theo những đặc điểm, chẳng hạn như:
- ngữ nghĩa
- tỷ lệ
- các tài sản
Ngoài ra, tầm quan trọng của mỗi biến cung cấp các loại thông tin khác nhau về:
- mô hình
- tập dữ liệu
- quy trình đào tạo
Ví dụ: số lượng điều kiện chứa một tính năng cụ thể cho biết mức độ quan trọng của cây quyết định đối với tính năng này. Điều này có thể cho biết tầm quan trọng thay đổi. Suy cho cùng, thuật toán học tập sẽ không sử dụng một tính năng trong nhiều điều kiện nếu tính năng đó không quan trọng. Tuy nhiên, cùng một tính năng xuất hiện trong nhiều điều kiện cũng có thể cho biết rằng một mô hình đang thử nhưng không thể khái quát hoá mẫu của một tính năng. Ví dụ: điều này có thể xảy ra khi một tính năng chỉ là một giá trị nhận dạng mẫu không có thông tin để khái quát hoá.
Mặt khác, giá trị cao cho tầm quan trọng của biến hoán vị cao cho biết việc xoá một tính năng sẽ ảnh hưởng xấu đến mô hình, đây là một chỉ báo về tầm quan trọng biến đổi. Tuy nhiên, nếu mô hình này mạnh mẽ, việc xoá bất kỳ tính năng nào cũng không gây ảnh hưởng đến mô hình.
Vì mức độ quan trọng của các biến khác nhau cho biết các khía cạnh khác nhau của mô hình, nên việc xem xét một số mức độ quan trọng cùng một lúc sẽ mang lại nhiều thông tin hữu ích. Ví dụ: nếu một tính năng có ý nghĩa quan trọng theo tất cả các mức độ quan trọng của biến, thì tính năng này có thể đóng vai trò quan trọng. Một ví dụ khác: nếu một tính năng có tầm quan trọng biến "số nút" cao và tầm quan trọng biến đổi nhỏ "hoán vị", thì tính năng này có thể khó tổng quát hoá và có thể làm ảnh hưởng đến chất lượng của mô hình.
model.describe()
và xem thẻ "mức độ quan trọng biến".
Hãy xem
Hướng dẫn tìm hiểu mô hình để biết thêm thông tin chi tiết.