Présentation

Les forêts de décisions offrent les avantages suivants:

  • Ils sont plus faciles à configurer que les réseaux de neurones. Les forêts de décision comportent moins d'hyperparamètres. De plus, les hyperparamètres des forêts de décision fournissent de bons paramètres par défaut.
  • Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Cela signifie que vous pouvez écrire beaucoup moins de code de prétraitement qu'avec un réseau de neurones, ce qui vous fait gagner du temps et réduit les sources d'erreurs.
  • Ils donnent souvent de bons résultats prêts à l'emploi, sont robustes aux données bruyantes et présentent des propriétés interprétables.
  • Ils effectuent des inférences et s'entraînent sur de petits ensembles de données (< 1 million d'exemples) beaucoup plus rapidement que les réseaux de neurones.

Les forêts de décision produisent d'excellents résultats dans les concours de machine learning et sont largement utilisées dans de nombreuses tâches industrielles.

Ce cours présente les arbres de décision et les forêts de décision. Les forêts d'arbres décisionnels sont une famille d'algorithmes de machine learning interprétables qui excelle avec les données tabulaires. Les forêts de décision peuvent effectuer les opérations suivantes:

Code YDF
Ce cours explique le fonctionnement des forêts de décisions sans se concentrer sur des bibliothèques spécifiques. Toutefois, tout au long du cours, des zones de texte présentent des exemples de code qui s'appuient sur la bibliothèque de forêts de décision YDF, mais qui peuvent être convertis en d'autres bibliothèques de forêts de décision.

Prérequis

Ce cours suppose que vous avez suivi les cours suivants ou que vous disposez de connaissances équivalentes:

Bonne formation !