Jenis kondisi

Unit ini berfokus pada berbagai jenis kondisi yang digunakan untuk membuat keputusan pohon.

Kondisi rata sumbu vs. miring

Kondisi diratakan sumbu hanya melibatkan satu fitur. Miring kondisi yang melibatkan beberapa fitur. Sebagai contoh, berikut ini adalah kondisi sejajar sumbu:

num_legs ≥ 2

Meskipun yang berikut ini adalah kondisi miring:

num_legs ≥ num_fingers

Sering kali, pohon keputusan dilatih hanya dengan kondisi yang sejajar sumbu. Namun, pemisahan yang miring lebih efektif karena dapat mengekspresikan lebih kompleks pola-pola tersebut. Pemisahan yang miring terkadang memberikan hasil yang lebih baik dengan mengorbankan biaya pelatihan dan inferensi yang lebih tinggi.

Kode YDF
Dalam YDF, pohon keputusan dilatih dengan kondisi sejajar sumbu secara default. Anda dapat mengaktifkan pohon keputusan oblique dengan Parameter split_axis="SPARSE_OBLIQUE".

Kondisi yang disejajarkan dengan sumbu adalah "num_legs >= 3". Kondisi miringnya adalah
  "jumlah_kaki + berat * 5 >= 12".

Gambar 4. Contoh kondisi sejajar sumbu dan kondisi miring.

 

Membuat grafik dua kondisi sebelumnya menghasilkan ruang fitur berikut separation (pemisahan):

Grafik bobot vs. num_legs. Kondisi yang sejajar dengan sumbu ini tidak
  mengabaikan bobot, sehingga hanya berupa garis vertikal. Miring
  kondisi menunjukkan garis miring negatif.

Gambar 5. Pemisahan ruang fitur untuk kondisi dalam Gambar 4.

 

Kondisi biner vs. non-biner

Kondisi dengan dua kemungkinan hasil (misalnya, benar atau salah) disebut kondisi biner. Pohon keputusan yang hanya berisi kondisi biner adalah yang disebut pohon keputusan biner.

Kondisi non-biner memiliki lebih dari dua kemungkinan hasil. Oleh karena itu, kondisi non-biner memiliki kekuatan diskriminatif yang lebih besar daripada kondisi biner. Keputusan yang berisi satu atau beberapa kondisi non-biner disebut keputusan non-biner pohon.

Perbandingan pohon keputusan biner vs. non-biner. Keputusan biner
  pohon berisi dua 
kondisi biner; pohon keputusan non-biner
  berisi satu kondisi non-biner.

Gambar 6: Pohon keputusan biner versus non-biner.

 

Kondisi dengan terlalu banyak kondisi daya mesin juga cenderung menjadi overfit. Oleh karena itu, hutan keputusan umumnya menggunakan pohon keputusan biner, jadi pelatihan ini akan fokus pada mereka.

Jenis kondisi yang paling umum adalah kondisi batas yang dinyatakan sebagai:

featurethreshold

Contoh:

num_legs ≥ 2

Ada jenis kondisi lain. Berikut ini adalah jenis perangkat lunak lain yang kondisi biner:

 

Tabel 2. Jenis kondisi biner yang umum.

Nama Kondisi Contoh
kondisi batas $\mathrm{fitur}_i \geq \mathrm{nilai minimum}$ $\mathrm{num\_legs} \geq 2$
ketentuan kesetaraan $\mathrm{fitur}_i = \mathrm{value}$ $\mathrm{spesies} = ``kucing"$
kondisi dalam ditetapkan $\mathrm{fitur}_i \in \mathrm{collection}$ $\mathrm{spesies} \in \{``kucing", ``dog", ``burung"\}$
kondisi miring $\sum_{i} \mathrm{weight}_i \mathrm{fitur}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
fitur tidak ada $\mathrm{fitur}_i \mathrm{is} \mathrm{Tidak Ada}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Tidak Ada}$