Introduction

Ce cours présente les arbres de décision et les forêts de décisions.

Les forêts d'arbres décisionnels forment une famille de modèles et d'algorithmes de machine learning supervisés. Ils offrent les avantages suivants:

  • Elles sont plus faciles à configurer que les réseaux de neurones. Les forêts d'arbres décisionnels comportent moins d'hyperparamètres. En outre, les hyperparamètres des forêts de décision fournissent de bons valeurs par défaut.
  • Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Vous pouvez ainsi écrire beaucoup moins de code de prétraitement qu'avec un réseau de neurones, ce qui vous permet de gagner du temps et de réduire les sources d'erreur.
  • Elles donnent souvent de bons résultats prêts à l'emploi, robustes pour les données bruyantes et comportent des propriétés interprétables.
  • Ils déduits et s'entraînent sur de petits ensembles de données (moins de 1 million d'exemples) bien plus rapidement que les réseaux de neurones.

Les forêts d'arbres décisionnels produisent d'excellents résultats dans les concours de machine learning et sont très utilisés dans de nombreuses tâches industrielles. Les forêts de décision sont pratiques, efficaces et interprétables. Vous pouvez utiliser des forêts d'arbres décisionnels pour de nombreuses tâches d'apprentissage supervisé, y compris:

Le contenu de ce cours est générique pour les forêts d'arbres décisionnels et indépendant de toute bibliothèque spécifique. Toutefois, les cases orange telles que celle-ci contiennent des exemples de code qui utilisent la bibliothèque TensorFlow Decision Forests (TF-DF). Bien que spécifiques à TF-DF, ces exemples sont souvent convertis facilement en autres bibliothèques de forêts d'arbres décisionnels.

Conditions préalables

Pour suivre ce cours, vous devez avoir suivi les cours suivants ou disposer de connaissances équivalentes:

Bonne formation !