Les forêts de décision offrent les avantages suivants:
- Ils sont plus faciles à configurer que les réseaux de neurones. Les forêts de décision ont moins d'hyperparamètres. De plus, les hyperparamètres des forêts de décision fournissent de bonnes valeurs par défaut.
- Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Cela signifie que vous pouvez écrire beaucoup moins de code de prétraitement qu'en utilisant un réseau de neurones, ce qui vous fait gagner du temps et réduit les sources d'erreur.
- Ils donnent souvent de bons résultats prêts à l'emploi, résistent aux données contenant du bruit et présentent des propriétés interprétables.
- Ils infèrent et s'entraînent sur de petits ensembles de données (moins d'un million d'exemples) beaucoup plus rapidement que les réseaux de neurones.
Les forêts de décision génèrent d'excellents résultats dans les compétitions de machine learning et sont très utilisées dans de nombreuses tâches industrielles.
Ce cours présente les arbres de décision et les forêts de décision. Les forêts de décision sont une famille d'algorithmes de machine learning interprétables qui excellent avec les données tabulaires. Les forêts de décision peuvent effectuer les opérations suivantes:
Prérequis
Pour ce cours, nous partons du principe que vous avez suivi les cours suivants ou que vous disposez de connaissances équivalentes:
- Cours d'initiation au machine learning
- Identification des problèmes en machine learning
- Préparation des données et extraction de caractéristiques
Bonne formation !