Les forêts de décisions offrent les avantages suivants:
Ils sont plus faciles à configurer que les réseaux de neurones. Les forêts de décision comportent moins d'hyperparamètres. De plus, les hyperparamètres des forêts de décision fournissent de bons paramètres par défaut.
Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Cela signifie que vous pouvez écrire beaucoup moins de code de prétraitement qu'avec un réseau de neurones, ce qui vous fait gagner du temps et réduit les sources d'erreurs.
Ils donnent souvent de bons résultats prêts à l'emploi, sont robustes aux données bruyantes et présentent des propriétés interprétables.
Ils effectuent des inférences et s'entraînent sur de petits ensembles de données (< 1 million d'exemples) beaucoup plus rapidement que les réseaux de neurones.
Les forêts de décision produisent d'excellents résultats dans les concours de machine learning et sont largement utilisées dans de nombreuses tâches industrielles.
Ce cours présente les arbres de décision et les forêts de décision.
Les forêts d'arbres décisionnels sont une famille d'algorithmes de machine learning interprétables qui excelle avec les données tabulaires.
Les forêts de décision peuvent effectuer les opérations suivantes:
Ce cours explique le fonctionnement des forêts de décisions sans se concentrer sur des bibliothèques spécifiques.
Toutefois, tout au long du cours, des zones de texte présentent des exemples de code qui s'appuient sur la bibliothèque de forêts de décision YDF, mais qui peuvent être convertis en d'autres bibliothèques de forêts de décision.
Prérequis
Ce cours suppose que vous avez suivi les cours suivants ou que vous disposez de connaissances équivalentes:
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/02/25 (UTC).
[null,null,["Dernière mise à jour le 2025/02/25 (UTC)."],[[["Decision forests are interpretable machine learning algorithms that work well with tabular data for tasks like classification, regression, and ranking."],["Decision forests offer advantages such as easy configuration, native handling of various data types, robustness to noise, and fast inference/training on smaller datasets."],["This course provides a comprehensive understanding of decision trees and forests, including how they make predictions, different types, performance considerations, and effective usage strategies."],["The course uses YDF library code examples to demonstrate concepts, but the knowledge is transferable to other decision forest libraries."],["Basic machine learning knowledge and familiarity with data preprocessing are prerequisites for this course."]]],[]]