Types de conditions

Ce module présente différents types de conditions permettant de prendre des décisions arbres.

Alignement sur l'axe et conditions obliques

Une condition alignée sur l'axe n'implique qu'une seule caractéristique. Un oblique implique plusieurs caractéristiques. Voici un exemple condition d'alignement sur l'axe:

num_legs ≥ 2

Alors que ce qui suit est une condition oblique:

num_legs ≥ num_fingers

Souvent, les arbres de décision sont entraînés uniquement avec des conditions alignées sur les axes. Toutefois, les divisions obliques sont plus puissantes, car elles peuvent exprimer des expressions plus complexes modèles de ML. Les divisions obliques produisent parfois de meilleurs résultats, au détriment des coûts d'entraînement et d'inférence plus élevés.

Code YDF
Dans YDF, les arbres de décision sont entraînés par défaut avec une condition alignée sur les axes. Vous pouvez activer les arbres de décision obliques à l'aide de la commande Paramètre split_axis="SPARSE_OBLIQUE".

La condition alignée sur l'axe est "num_legs >= 3". La condition oblique est
  "num_legs + weight * 5 >= 12".

<ph type="x-smartling-placeholder"></ph> Figure 4. Exemples de condition alignée sur l'axe et d'oblique.

 

La représentation graphique des deux conditions précédentes génère l'espace de caractéristiques suivant. la séparation:

Graphique de pondération par rapport à num_legs. La condition d&#39;alignement sur l&#39;axe ne
  ignore le poids et n&#39;est donc qu&#39;une ligne verticale. L&#39;oblique
  indique une ligne avec une pente négative.

<ph type="x-smartling-placeholder"></ph> Figure 5. Séparation de l'espace des caractéristiques pour les conditions de la figure 4.

 

Conditions binaires et conditions non binaires

Les conditions avec deux résultats possibles (par exemple, vrai ou faux) sont appelées conditions binaires. Les arbres de décision ne contenant que des conditions binaires sont appelés arbres de décision binaires.

Les conditions non binaires ont plus de deux résultats possibles. Par conséquent, les conditions non binaires ont un pouvoir discriminatif plus important que les conditions binaires. Les décisions contenant une ou plusieurs conditions non binaires sont appelées décision non binaire arbres.

Une comparaison des arbres de décision binaires et non binaires. La décision binaire
  L&#39;arborescence contient deux conditions binaires : l&#39;arbre de décision non binaire
  contient une condition non binaire.

<ph type="x-smartling-placeholder"></ph> Figure 6: Arbres de décision binaires et non binaires

 

Conditions avec trop de maladies le pouvoir sont également plus susceptibles de surapprentissage. Pour cette raison, les forêts de décision utilisent généralement des arbres de décision binaires. Nous nous concentrerons donc sur eux dans ce cours.

Le type de condition le plus courant est la condition de seuil, exprimée comme suit:

featurethreshold

Exemple :

num_legs ≥ 2

Il existe d'autres types de conditions. Vous trouverez ci-dessous d'autres types couramment utilisés Conditions binaires:

 

<ph type="x-smartling-placeholder"></ph> Tableau 2. Types courants de conditions binaires.

Nom Condition Exemple
condition de seuil $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
condition d'égalité $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
condition dans l'ensemble $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \n``chat", ``chien", ``oiseau"\}$
condition oblique $\sum_{i} \mathrm{poids}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
fonctionnalité manquante $\mathrm{feature}_i \mathrm{est} \mathrm{Manquant}$ $\mathrm{num\_legs} \mathrm{est} \mathrm{Manquant}$