Cette page vous invite à répondre à une série d'exercices à choix multiples sur le contenu abordé dans l'unité "Entraînement des arbres de décision".
Question 1
Quels sont les effets du remplacement des caractéristiques numériques par leurs valeurs négatives (par exemple, en remplaçant la valeur +8 par -8) avec le séparateur numérique exact ?
Les mêmes conditions seront apprises. Seuls les enfants positifs/négatifs seront modifiés.
Magnifique.
Différentes conditions seront apprises, mais la structure globale de l'arbre de décision restera la même.
Si les fonctionnalités changent, les conditions changent également.
La structure de l'arbre de décision sera complètement différente.
La structure de l'arbre de décision sera à peu près la même. Les conditions changeront toutefois.
Question 2
Quelles sont les deux réponses qui décrivent le mieux l'effet de ne tester que la moitié (sélectionnée au hasard) des valeurs de seuil candidates dans X ?
Le gain d'information serait supérieur ou égal.
Le gain d'information serait inférieur ou égal.
Bravo !
La précision des tests de l'arbre de décision final serait alors moins bonne.
L'arbre de décision final n'aurait pas une meilleure justesse d'entraînement.
Bravo !
Question 3
Que se passerait-il si la courbe "gain d'information" par rapport au "seuil" présentait plusieurs maxima locaux ?
Il est impossible d'avoir plusieurs maxima locaux.
Plusieurs maxima locaux sont possibles.
L'algorithme sélectionnerait les maxima locaux avec la valeur de seuil la plus faible.
L'algorithme sélectionnerait la valeur maximale globale.
Bravo !
Question 4
Calculez le gain d'information de la division suivante:
Nœud | Nombre d'exemples positifs | Nombre d'exemples négatifs |
---|---|---|
nœud parent | 10 | 6 |
premier enfant | 8 | 2 |
deuxième enfant | 2 | 4 |