Forêts de décision

Une forêt d'arbres de décision est un terme générique qui décrit les modèles constitués de plusieurs arbres de décision. La prédiction d'une forêt d'arbres de décision est l'agrégation des prédictions de ses arbres de décision. L'implémentation de cette agrégation dépend de l'algorithme utilisé pour entraîner la forêt de décision. Par exemple, dans une forêt aléatoire de classification multiclasse (un type de forêt de décision), chaque arbre vote pour une seule classe, et la prédiction de la forêt aléatoire correspond à la classe la plus représentée. Dans une classification binaire, un arbre boosté par gradient (GBT, Gradient Boosted Tree) (autre type de forêt de décision) produit un logit (valeur à virgule flottante), et la prédiction de l'arbre boosté par gradient est la somme de ces valeurs suivie d'une fonction d'activation (par exemple, une fonction sigmoïde).

Les deux chapitres suivants décrivent ces deux algorithmes de forêts de décision.