Unit ini berfokus pada berbagai jenis kondisi yang digunakan untuk membuat keputusan pohon.
Kondisi rata sumbu vs. miring
Kondisi diratakan sumbu hanya melibatkan satu fitur. Miring kondisi yang melibatkan beberapa fitur. Sebagai contoh, berikut ini adalah kondisi sejajar sumbu:
num_legs ≥ 2
Meskipun yang berikut ini adalah kondisi miring:
num_legs ≥ num_fingers
Sering kali, pohon keputusan dilatih hanya dengan kondisi yang sejajar sumbu. Namun, pemisahan yang miring lebih efektif karena dapat mengekspresikan lebih kompleks pola-pola tersebut. Pemisahan yang miring terkadang memberikan hasil yang lebih baik dengan mengorbankan biaya pelatihan dan inferensi yang lebih tinggi.
split_axis="SPARSE_OBLIQUE"
.
Gambar 4. Contoh kondisi sejajar sumbu dan kondisi miring.
Membuat grafik dua kondisi sebelumnya menghasilkan ruang fitur berikut separation (pemisahan):
Gambar 5. Pemisahan ruang fitur untuk kondisi dalam Gambar 4.
Kondisi biner vs. non-biner
Kondisi dengan dua kemungkinan hasil (misalnya, benar atau salah) disebut kondisi biner. Pohon keputusan yang hanya berisi kondisi biner adalah yang disebut pohon keputusan biner.
Kondisi non-biner memiliki lebih dari dua kemungkinan hasil. Oleh karena itu, kondisi non-biner memiliki kekuatan diskriminatif yang lebih besar daripada kondisi biner. Keputusan yang berisi satu atau beberapa kondisi non-biner disebut keputusan non-biner pohon.
Gambar 6: Pohon keputusan biner versus non-biner.
Kondisi dengan terlalu banyak kondisi daya mesin juga cenderung menjadi overfit. Oleh karena itu, hutan keputusan umumnya menggunakan pohon keputusan biner, jadi pelatihan ini akan fokus pada mereka.
Jenis kondisi yang paling umum adalah kondisi batas yang dinyatakan sebagai:
feature ≥ threshold
Contoh:
num_legs ≥ 2
Ada jenis kondisi lain. Berikut ini adalah jenis perangkat lunak lain yang kondisi biner:
Tabel 2. Jenis kondisi biner yang umum.
Nama | Kondisi | Contoh |
kondisi batas | $\mathrm{fitur}_i \geq \mathrm{nilai minimum}$ | $\mathrm{num\_legs} \geq 2$ |
ketentuan kesetaraan | $\mathrm{fitur}_i = \mathrm{value}$ | $\mathrm{spesies} = ``kucing"$ |
kondisi dalam ditetapkan | $\mathrm{fitur}_i \in \mathrm{collection}$ | $\mathrm{spesies} \in \{``kucing", ``dog", ``burung"\}$ |
kondisi miring | $\sum_{i} \mathrm{weight}_i \mathrm{fitur}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
fitur tidak ada | $\mathrm{fitur}_i \mathrm{is} \mathrm{Tidak Ada}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{Tidak Ada}$ |