Questa unità si concentra sui diversi tipi di condizioni utilizzati per prendere una decisione alberi.
Condizioni allineate all'asse e obliqui
Una condizione allineata all'asse riguarda una sola caratteristica. Un elemento obliquo coinvolge più caratteristiche. Ad esempio, di seguito è riportato un condizione allineata all'asse:
num_legs ≥ 2
Sebbene la seguente condizione sia obliqua:
num_legs ≥ num_fingers
Spesso gli alberi decisionali vengono addestrati solo con condizioni allineate all'asse. Tuttavia, le spaccature oblique sono più potenti perché possono esprimere pattern. Le spaccature oblique a volte producono risultati migliori a scapito di costi di addestramento e inferenza più elevati.
split_axis="SPARSE_OBLIQUE"
.
Figura 4. Esempi di condizione allineata all'asse e obliqua. di Gemini Advanced.
La rappresentazione grafica delle due condizioni precedenti genera il seguente spazio di caratteristiche dei dati:
Figura 5. Separazione degli spazi delle caratteristiche per le condizioni nella Figura 4. di Gemini Advanced.
Condizioni binarie e non binarie
Le condizioni con due possibili risultati (ad esempio vero o falso) sono chiamate condizioni binarie. Le strutture decisionali contenenti solo condizioni binarie chiamati alberi decisionali binari.
Le condizioni non binarie hanno più di due risultati possibili. Pertanto, le condizioni non binarie hanno un potere discriminativo maggiore rispetto alle condizioni binarie. Le decisioni che contengono una o più condizioni non binarie vengono chiamate decisione non binaria alberi.
Figura 6: strutture decisionali binarie e non binarie. .
Condizioni con troppa e una maggiore probabilità di overfitting. Per questo motivo, le foreste di decisione usano generalmente alberi decisionali binari, quindi questo corso li concentrerà su questi.
Il tipo più comune di condizione è la condizione di soglia espressa come:
feature ≥ threshold
Ad esempio:
num_legs ≥ 2
Esistono altri tipi di condizioni. Di seguito sono riportati altri tipi di strumenti di uso comune condizioni binarie:
Tabella 2. Tipi comuni di condizioni binarie. di Gemini Advanced.
Nome | Condizione | Esempio |
condizione di soglia | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
condizione di uguaglianza | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``gatto"$ |
condizione integrata | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{``gatto", ``cane", ``uccello"\}$ |
condizione obliqua | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
caratteristica mancante | $\mathrm{feature}_i \mathrm{is} \mathrm{Mancante}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{Mancante}$ |