Ce module présente différents types de conditions permettant de prendre des décisions arbres.
Alignement sur l'axe et conditions obliques
Une condition alignée sur l'axe n'implique qu'une seule caractéristique. Un oblique implique plusieurs caractéristiques. Voici un exemple condition d'alignement sur l'axe:
num_legs ≥ 2
Alors que ce qui suit est une condition oblique:
num_legs ≥ num_fingers
Souvent, les arbres de décision sont entraînés uniquement avec des conditions alignées sur les axes. Toutefois, les divisions obliques sont plus puissantes, car elles peuvent exprimer des expressions plus complexes modèles de ML. Les divisions obliques produisent parfois de meilleurs résultats, au détriment des coûts d'entraînement et d'inférence plus élevés.
split_axis="SPARSE_OBLIQUE"
.
<ph type="x-smartling-placeholder"></ph> Figure 4. Exemples de condition alignée sur l'axe et d'oblique.
La représentation graphique des deux conditions précédentes génère l'espace de caractéristiques suivant. la séparation:
<ph type="x-smartling-placeholder"></ph> Figure 5. Séparation de l'espace des caractéristiques pour les conditions de la figure 4.
Conditions binaires et conditions non binaires
Les conditions avec deux résultats possibles (par exemple, vrai ou faux) sont appelées conditions binaires. Les arbres de décision ne contenant que des conditions binaires sont appelés arbres de décision binaires.
Les conditions non binaires ont plus de deux résultats possibles. Par conséquent, les conditions non binaires ont un pouvoir discriminatif plus important que les conditions binaires. Les décisions contenant une ou plusieurs conditions non binaires sont appelées décision non binaire arbres.
<ph type="x-smartling-placeholder"></ph> Figure 6: Arbres de décision binaires et non binaires
Conditions avec trop de maladies le pouvoir sont également plus susceptibles de surapprentissage. Pour cette raison, les forêts de décision utilisent généralement des arbres de décision binaires. Nous nous concentrerons donc sur eux dans ce cours.
Le type de condition le plus courant est la condition de seuil, exprimée comme suit:
feature ≥ threshold
Exemple :
num_legs ≥ 2
Il existe d'autres types de conditions. Vous trouverez ci-dessous d'autres types couramment utilisés Conditions binaires:
<ph type="x-smartling-placeholder"></ph> Tableau 2. Types courants de conditions binaires.
Nom | Condition | Exemple |
condition de seuil | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
condition d'égalité | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``cat"$ |
condition dans l'ensemble | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \n``chat", ``chien", ``oiseau"\}$ |
condition oblique | $\sum_{i} \mathrm{poids}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
fonctionnalité manquante | $\mathrm{feature}_i \mathrm{est} \mathrm{Manquant}$ | $\mathrm{num\_legs} \mathrm{est} \mathrm{Manquant}$ |