Unit ini berfokus pada berbagai jenis kondisi yang digunakan untuk membuat hierarki keputusan.
Kondisi sejajar sumbu vs. miring
Kondisi yang sejajar sumbu hanya melibatkan satu fitur. Kondisi miring melibatkan beberapa fitur. Misalnya, berikut adalah kondisi yang sejajar dengan sumbu:
num_legs ≥ 2
Sedangkan berikut adalah kondisi miring:
num_legs ≥ num_fingers
Sering kali, pohon keputusan dilatih hanya dengan kondisi yang sejajar dengan sumbu. Namun, pemisahan miring lebih efektif karena dapat mengekspresikan pola yang lebih kompleks. Pemisahan miring terkadang menghasilkan hasil yang lebih baik dengan mengorbankan biaya pelatihan dan inferensi yang lebih tinggi.
split_axis="SPARSE_OBLIQUE"
.
Gambar 4. Contoh kondisi yang sejajar sumbu dan kondisi miring.
Membuat grafik dua kondisi sebelumnya akan menghasilkan pemisahan ruang fitur berikut:
Gambar 5. Pemisahan ruang fitur untuk kondisi dalam Gambar 4.
Kondisi biner vs. non-biner
Kondisi dengan dua kemungkinan hasil (misalnya, benar atau salah) disebut kondisi biner. Pohon keputusan yang hanya berisi kondisi biner disebut pohon keputusan biner.
Kondisi non-biner memiliki lebih dari dua kemungkinan hasil. Oleh karena itu, kondisi non-biner memiliki daya diskriminatif yang lebih besar daripada kondisi biner. Keputusan yang berisi satu atau beberapa kondisi non-biner disebut pohon keputusan non-biner.
Gambar 6: Hierarki keputusan biner versus non-biner.
Kondisi dengan terlalu banyak daya juga lebih cenderung mengalami overfitting. Karena alasan ini, hutan keputusan umumnya menggunakan pohon keputusan biner, sehingga kursus ini akan berfokus pada pohon keputusan biner.
Jenis kondisi yang paling umum adalah kondisi nilai minimum yang dinyatakan sebagai:
feature ≥ threshold
Contoh:
num_legs ≥ 2
Ada jenis kondisi lainnya. Berikut adalah jenis kondisi biner lain yang umum digunakan:
Tabel 2. Jenis kondisi biner yang umum.
Name | Kondisi | Contoh |
kondisi nilai minimum | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
kondisi kesetaraan | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``cat"$ |
kondisi dalam set | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$ |
kondisi miring | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
fitur tidak ada | $\mathrm{feature}_i \mathrm{is} \mathrm{Missing}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$ |