Jenis kondisi

Unit ini berfokus pada berbagai jenis conditions yang digunakan untuk membuat pohon keputusan.

Kondisi sejajar sumbu vs. miring

Kondisi yang disejajarkan dengan sumbu hanya melibatkan satu fitur. Kondisi oblique melibatkan beberapa fitur. Misalnya, berikut ini adalah kondisi yang disejajarkan dengan sumbu:

num_legs ≥ 2

Sementara yang berikut adalah kondisi miring:

num_legs ≥ num_fingers

Sering kali, pohon keputusan dilatih hanya dengan kondisi selaras sumbu. Namun, pemisahan miring lebih canggih karena dapat mengekspresikan pola yang lebih kompleks. Pemisahan miring terkadang memberikan hasil yang lebih baik dengan mengorbankan biaya pelatihan dan inferensi yang lebih tinggi.

Kode YDF
Dalam YDF, pohon keputusan dilatih dengan kondisi selaras sumbu secara default. Anda dapat mengaktifkan hierarki miring keputusan dengan parameter split_axis="SPARSE_OBLIQUE".

Kondisi yang disejajarkan dengan sumbu adalah "num_legs >= 3". Kondisi miringnya adalah
  "num_legs + weight * 5 >= 12".

Gambar 4. Contoh kondisi yang selaras dengan sumbu dan kondisi miring.

 

Membuat grafik dua kondisi sebelumnya menghasilkan pemisahan ruang fitur berikut:

Grafik berat vs. num_legs. Kondisi yang disejajarkan dengan sumbu tidak
  mengabaikan bobot, sehingga hanya berupa garis vertikal. Kondisi miring menunjukkan garis miring negatif.

Gambar 5. Pemisahan ruang fitur untuk kondisi pada Gambar 4.

 

Kondisi biner vs. non-biner

Kondisi dengan dua kemungkinan hasil (misalnya, benar atau salah) disebut kondisi biner. Pohon keputusan yang hanya berisi kondisi biner disebut pohon keputusan biner.

Kondisi non-biner memiliki lebih dari dua kemungkinan hasil. Oleh karena itu, kondisi non-biner memiliki daya diskriminatif yang lebih besar daripada kondisi biner. Keputusan yang berisi satu atau beberapa kondisi non-biner disebut hierarki keputusan non-biner.

Perbandingan pohon keputusan biner vs. non-biner. Pohon keputusan biner berisi dua kondisi biner; pohon keputusan non-biner berisi satu kondisi non-biner.

Gambar 6: Pohon keputusan biner versus non-biner.

 

Kondisi dengan daya yang terlalu banyak juga cenderung mengalami overfit. Karena alasan ini, forest keputusan umumnya menggunakan pohon keputusan biner, sehingga kursus ini akan berfokus padanya.

Jenis kondisi yang paling umum adalah kondisi nilai minimum yang dinyatakan sebagai:

featurethreshold

Contoh:

num_legs ≥ 2

Ada jenis kondisi lainnya. Berikut adalah jenis kondisi biner lain yang umum digunakan:

 

Tabel 2. Jenis kondisi biner yang umum.

Nama Kondisi Contoh
kondisi batas $\mathrm{fitur}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
kondisi kesetaraan $\mathrm{fitur}_i = \mathrm{nilai}$ $\mathrm{spesies} = ``kucing"$
kondisi dalam set $\mathrm{fitur}_i \in \mathrm{koleksi}$ $\mathrm{spesies} \in \{``kucing", ``", ``burung"\}$
kondisi miring $\sum_{i} \mathrm{bobot}_i \mathrm{fitur}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
fitur tidak ada $\mathrm{fitur}_i \mathrm{is} \mathrm{Tidak ada}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Tidak ada}$