Tipi di condizioni

Questa unità si concentra sui diversi tipi di condizioni utilizzati per prendere una decisione alberi.

Condizioni allineate all'asse e obliqui

Una condizione allineata all'asse riguarda una sola caratteristica. Un elemento obliquo coinvolge più caratteristiche. Ad esempio, di seguito è riportato un condizione allineata all'asse:

num_legs ≥ 2

Sebbene la seguente condizione sia obliqua:

num_legs ≥ num_fingers

Spesso gli alberi decisionali vengono addestrati solo con condizioni allineate all'asse. Tuttavia, le spaccature oblique sono più potenti perché possono esprimere pattern. Le spaccature oblique a volte producono risultati migliori a scapito di costi di addestramento e inferenza più elevati.

Codice YDF
In YDF, per impostazione predefinita gli alberi decisionali vengono addestrati con la condizione allineata all'asse. Puoi attivare gli alberi decisionali oblique con il parametro Parametro split_axis="SPARSE_OBLIQUE".

La condizione allineata all'asse è "num_legs >= 3". La condizione obliqua è
  "num_legs + peso * 5 >= 12".

Figura 4. Esempi di condizione allineata all'asse e obliqua. di Gemini Advanced.

 

La rappresentazione grafica delle due condizioni precedenti genera il seguente spazio di caratteristiche dei dati:

Un grafico del peso rispetto a num_legs. La condizione allineata all'asse non
  ignora il peso ed è quindi solo una linea verticale. L'obliquo
  mostra una linea inclinata negativa.

Figura 5. Separazione degli spazi delle caratteristiche per le condizioni nella Figura 4. di Gemini Advanced.

 

Condizioni binarie e non binarie

Le condizioni con due possibili risultati (ad esempio vero o falso) sono chiamate condizioni binarie. Le strutture decisionali contenenti solo condizioni binarie chiamati alberi decisionali binari.

Le condizioni non binarie hanno più di due risultati possibili. Pertanto, le condizioni non binarie hanno un potere discriminativo maggiore rispetto alle condizioni binarie. Le decisioni che contengono una o più condizioni non binarie vengono chiamate decisione non binaria alberi.

Un confronto tra strutture decisionali binarie e non binarie. La decisione binaria
  contiene due condizioni binarie; l'albero decisionale non binario
  contiene una condizione non binaria.

Figura 6: strutture decisionali binarie e non binarie. .

 

Condizioni con troppa e una maggiore probabilità di overfitting. Per questo motivo, le foreste di decisione usano generalmente alberi decisionali binari, quindi questo corso li concentrerà su questi.

Il tipo più comune di condizione è la condizione di soglia espressa come:

featurethreshold

Ad esempio:

num_legs ≥ 2

Esistono altri tipi di condizioni. Di seguito sono riportati altri tipi di strumenti di uso comune condizioni binarie:

 

Tabella 2. Tipi comuni di condizioni binarie. di Gemini Advanced.

Nome Condizione Esempio
condizione di soglia $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
condizione di uguaglianza $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``gatto"$
condizione integrata $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``gatto", ``cane", ``uccello"\}$
condizione obliqua $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
caratteristica mancante $\mathrm{feature}_i \mathrm{is} \mathrm{Mancante}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Mancante}$