Jenis kondisi

Unit ini berfokus pada berbagai jenis kondisi yang digunakan untuk membuat hierarki keputusan.

Kondisi sejajar sumbu vs. miring

Kondisi yang sejajar sumbu hanya melibatkan satu fitur. Kondisi miring melibatkan beberapa fitur. Misalnya, berikut adalah kondisi yang sejajar dengan sumbu:

num_legs ≥ 2

Sedangkan berikut adalah kondisi miring:

num_legs ≥ num_fingers

Sering kali, pohon keputusan dilatih hanya dengan kondisi yang sejajar dengan sumbu. Namun, pemisahan miring lebih efektif karena dapat mengekspresikan pola yang lebih kompleks. Pemisahan miring terkadang menghasilkan hasil yang lebih baik dengan mengorbankan biaya pelatihan dan inferensi yang lebih tinggi.

Kode YDF
Di YDF, pohon keputusan dilatih dengan kondisi yang sejajar dengan sumbu secara default. Anda dapat mengaktifkan hierarki miring keputusan dengan parameter split_axis="SPARSE_OBLIQUE".

Kondisi yang sejajar dengan sumbu adalah "num_legs >= 3". Kondisi miring adalah
  "num_legs + weight * 5 >= 12".

Gambar 4. Contoh kondisi yang sejajar sumbu dan kondisi miring.

 

Membuat grafik dua kondisi sebelumnya akan menghasilkan pemisahan ruang fitur berikut:

Grafik berat vs. num_legs. Kondisi yang sejajar dengan sumbu tidak
  mengabaikan bobot sehingga hanya berupa garis vertikal. Kondisi miring
  menunjukkan garis yang miring negatif.

Gambar 5. Pemisahan ruang fitur untuk kondisi dalam Gambar 4.

 

Kondisi biner vs. non-biner

Kondisi dengan dua kemungkinan hasil (misalnya, benar atau salah) disebut kondisi biner. Pohon keputusan yang hanya berisi kondisi biner disebut pohon keputusan biner.

Kondisi non-biner memiliki lebih dari dua kemungkinan hasil. Oleh karena itu, kondisi non-biner memiliki daya diskriminatif yang lebih besar daripada kondisi biner. Keputusan yang berisi satu atau beberapa kondisi non-biner disebut pohon keputusan non-biner.

Perbandingan pohon keputusan biner vs. non-biner. Pohon keputusan biner
  berisi dua kondisi biner; pohon keputusan non-biner
  berisi satu kondisi non-biner.

Gambar 6: Hierarki keputusan biner versus non-biner.

 

Kondisi dengan terlalu banyak daya juga lebih cenderung mengalami overfitting. Karena alasan ini, hutan keputusan umumnya menggunakan pohon keputusan biner, sehingga kursus ini akan berfokus pada pohon keputusan biner.

Jenis kondisi yang paling umum adalah kondisi nilai minimum yang dinyatakan sebagai:

featurethreshold

Contoh:

num_legs ≥ 2

Ada jenis kondisi lainnya. Berikut adalah jenis kondisi biner lain yang umum digunakan:

 

Tabel 2. Jenis kondisi biner yang umum.

Name Kondisi Contoh
kondisi nilai minimum $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
kondisi kesetaraan $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
kondisi dalam set $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
kondisi miring $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
fitur tidak ada $\mathrm{feature}_i \mathrm{is} \mathrm{Missing}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$