Các loại điều kiện

Bài này tập trung vào các loại điều kiện khác nhau được dùng để đưa ra quyết định cây xanh.

Điều kiện lệch trục so với xiên

Điều kiện căn chỉnh theo trục chỉ liên quan đến một tính năng duy nhất. Một góc xiên condition [tình trạng] liên quan đến nhiều tính năng. Ví dụ: sau đây là một điều kiện căn chỉnh theo trục:

num_legs ≥ 2

Mặc dù sau đây là điều kiện xiên:

num_legs ≥ num_fingers

Thông thường, cây quyết định được huấn luyện chỉ với các điều kiện căn chỉnh theo trục. Tuy nhiên, phân tách xiên mạnh hơn vì có thể biểu diễn những đường phức tạp hơn mẫu. Chia tách xiên đôi khi mang lại kết quả tốt hơn ở mức hao tổn giúp tăng chi phí huấn luyện và suy luận.

Mã YDF
Trong YDF, cây quyết định được huấn luyện với các điều kiện căn chỉnh theo trục theo mặc định. Bạn có thể bật cây xiên quyết định bằng Tham số split_axis="SPARSE_OBLIQUE".

Điều kiện căn chỉnh theo trục là "num_legs >= 3". Điều kiện xiên là
  "số_chân + cân nặng * 5 >= 12".

Hình 4. Ví dụ về điều kiện khớp trục và điều kiện xiên.

 

Vẽ đồ thị hai điều kiện trước tạo ra không gian tính năng sau đây phân tách:

Biểu đồ cân nặng so với số_ chân. Điều kiện căn chỉnh theo trục không
  bỏ qua trọng số và do đó chỉ là một đường dọc. Điểm xiên
  điều kiện cho thấy một đường có hệ số góc âm.

Hình 5. Phân tách không gian đối tượng cho các điều kiện trong Hình 4.

 

Điều kiện nhị phân so với phi nhị giới

Các điều kiện có hai kết quả có thể xảy ra (ví dụ: đúng hoặc sai) được gọi điều kiện nhị phân. Cây quyết định chỉ chứa các điều kiện nhị phân có tên là cây quyết định nhị phân.

Các điều kiện phi nhị giới có thể có nhiều hơn hai kết quả. Do đó, các điều kiện phi nhị giới có khả năng phân biệt đối xử cao hơn các điều kiện nhị phân. Những quyết định có chứa một hay nhiều điều kiện phi nhị giới được gọi là quyết định phi nhị giới cây.

So sánh cây quyết định nhị phân và phi nhị phân. Quyết định nhị phân
  cây chứa hai điều kiện nhị phân; cây quyết định phi nhị giới
  chứa một điều kiện phi nhị phân.

Hình 6: Cây quyết định nhị phân so với phi nhị phân.

 

Tình trạng có quá nhiều thông tin cũng có nhiều khả năng sẽ hoạt động quá mức. Vì lý do này, rừng quyết định thường sử dụng cây quyết định nhị phân, vì vậy khoá học này sẽ tập trung vào chúng.

Loại điều kiện phổ biến nhất là điều kiện ngưỡng được biểu thị dưới dạng:

featurethreshold

Ví dụ:

num_legs ≥ 2

Ngoài ra còn có các loại điều kiện khác. Sau đây là các loại điều kiện nhị phân:

 

Bảng 2. Các loại điều kiện nhị phân phổ biến.

Tên Điều kiện Ví dụ
điều kiện ngưỡng $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
điều kiện bằng $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``mèo"$
điều kiện đặt sẵn $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``mèo", ``chó", ``bird"\}$
điều kiện xiên $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_ Eyes} \geq 10$
thiếu tính năng $\mathrm{feature}_i \mathrm{is} \mathrm{Thiếu}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Thiếu}$