Tầm quan trọng của biến
Tầm quan trọng của biến (còn gọi là tầm quan trọng của đặc điểm) là một điểm số cho biết mức độ "quan trọng" của một đặc điểm đối với mô hình. Ví dụ: nếu đối với một mô hình nhất định có hai đặc điểm đầu vào "f1" và "f2", thì tầm quan trọng của biến là {f1=5,8, f2=2,5}, thì đặc điểm "f1" sẽ "quan trọng" hơn đối với mô hình so với đặc điểm "f2". Cũng như các mô hình học máy khác, tầm quan trọng của biến là một cách đơn giản để hiểu cách hoạt động của cây quyết định.
Bạn có thể áp dụng tầm quan trọng của biến không phụ thuộc vào mô hình, chẳng hạn như tầm quan trọng của biến hoán vị, cho cây quyết định.
Cây quyết định cũng có tầm quan trọng cụ thể của biến, chẳng hạn như:
- Tổng điểm phân tách với một biến nhất định.
- Số lượng nút có một biến nhất định.
- Độ sâu trung bình của lần xuất hiện đầu tiên của một đặc điểm trên tất cả các đường dẫn cây.
Mức độ quan trọng của biến có thể khác nhau tuỳ theo các đặc điểm như:
- ngữ nghĩa
- tỷ lệ
- các tài sản
Ngoài ra, mức độ quan trọng của biến cung cấp nhiều loại thông tin về:
- mô hình
- tập dữ liệu
- quá trình huấn luyện
Ví dụ: số lượng điều kiện chứa một đặc điểm cụ thể cho biết mức độ mà cây quyết định xem xét đặc điểm cụ thể này, điều này có thể cho biết tầm quan trọng của biến. Xét cho cùng, thuật toán học không thể sử dụng một tính năng trong nhiều điều kiện nếu điều kiện đó không quan trọng. Tuy nhiên, cùng một tính năng xuất hiện trong nhiều điều kiện cũng có thể cho biết rằng một mô hình đang cố gắng nhưng không thành công trong việc khái quát hoá mẫu của một tính năng. Ví dụ: điều này có thể xảy ra khi một tính năng chỉ là một giá trị nhận dạng mẫu không có thông tin để khái quát.
Mặt khác, giá trị cao cho mức độ quan trọng của biến hoán vị cao cho biết việc xoá một tính năng sẽ làm hỏng mô hình, đây là chỉ báo về mức độ quan trọng của biến. Tuy nhiên, nếu mô hình mạnh mẽ, việc xoá bất kỳ một tính năng nào cũng có thể không ảnh hưởng đến mô hình.
Vì mức độ quan trọng của các biến khác nhau cho biết các khía cạnh khác nhau của mô hình, nên việc xem xét nhiều mức độ quan trọng của biến cùng một lúc sẽ cung cấp thông tin hữu ích. Ví dụ: nếu một tính năng quan trọng theo tất cả các mức độ quan trọng của biến, thì tính năng này có thể quan trọng. Ví dụ khác: nếu một đặc điểm có tầm quan trọng cao của biến "số lượng nút" và tầm quan trọng thấp của biến "số hoán vị", thì đặc điểm này có thể khó khái quát hoá và có thể làm giảm chất lượng mô hình.
model.describe()
và xem thẻ "tầm quan trọng của biến".
Hãy xem
Hướng dẫn tìm hiểu về mô hình để biết thêm thông tin chi tiết.