Les forêts de décision offrent les avantages suivants:
Ils sont plus faciles à configurer que les réseaux de neurones. Les forêts de décision ont moins d'hyperparamètres. De plus, les hyperparamètres des forêts de décision fournissent de bonnes valeurs par défaut.
Elles gèrent de manière native les caractéristiques numériques, catégorielles et manquantes. Cela signifie que vous pouvez écrire beaucoup moins de code de prétraitement qu'en utilisant un réseau de neurones, ce qui vous fait gagner du temps et réduit les sources d'erreur.
Ils donnent souvent de bons résultats prêts à l'emploi, résistent aux données contenant du bruit et présentent des propriétés interprétables.
Ils infèrent et s'entraînent sur de petits ensembles de données (moins d'un million d'exemples) beaucoup plus rapidement que les réseaux de neurones.
Les forêts de décision génèrent d'excellents résultats dans les compétitions de machine learning et sont très utilisées dans de nombreuses tâches industrielles.
Ce cours présente les arbres de décision et les forêts de décision.
Les forêts de décision sont une famille d'algorithmes de machine learning interprétables qui excellent avec les données tabulaires.
Les forêts de décision peuvent effectuer les opérations suivantes:
Ce cours explique comment fonctionnent les forêts de décision sans vous concentrer sur des bibliothèques spécifiques.
Cependant, tout au long du cours, les zones de texte présentent des exemples de code qui s'appuient sur la bibliothèque de forêt de décision YDF, mais qui peuvent être converties en autres bibliothèques de forêt de décision.
Prérequis
Pour ce cours, nous partons du principe que vous avez suivi les cours suivants ou que vous disposez de connaissances équivalentes:
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2024/04/18 (UTC).
[null,null,["Dernière mise à jour le 2024/04/18 (UTC)."],[[["Decision forests are interpretable machine learning algorithms that work well with tabular data for tasks like classification, regression, and ranking."],["Decision forests offer advantages such as easy configuration, native handling of various data types, robustness to noise, and fast inference/training on smaller datasets."],["This course provides a comprehensive understanding of decision trees and forests, including how they make predictions, different types, performance considerations, and effective usage strategies."],["The course uses YDF library code examples to demonstrate concepts, but the knowledge is transferable to other decision forest libraries."],["Basic machine learning knowledge and familiarity with data preprocessing are prerequisites for this course."]]],[]]