Ensembles de données, généralisation et surapprentissage

Introduction

Ce module commence par une question suggestive. Choisissez l'une des réponses suivantes:

Si vous deviez prioriser l'amélioration de l'un des domaines suivants de votre projet de machine learning, impact?
Appliquer une fonction de perte plus intelligente pour entraîner le modèle
Améliorer la qualité de votre ensemble de données

Et voici une question encore plus tendancieuse:

Devinez: dans votre projet de machine learning, combien de temps consacrez-vous généralement à la préparation et à la transformation des données ?
Plus de la moitié du temps du projet
Moins de la moitié du temps du projet

Dans ce module, vous en apprendrez plus sur les caractéristiques du machine learning des ensembles de données, et comment préparer vos données pour garantir des résultats de haute qualité l'entraînement et l'évaluation de votre modèle.