Conjuntos de dados, generalização e overfitting

Introdução

Este módulo começa com uma pergunta sugestiva. Escolha uma das seguintes respostas:

Se você tiver que priorizar a melhoria de uma das áreas a seguir no projeto de machine learning, que teria a maior impacto?
Como aplicar uma função de perda mais inteligente para treinar o modelo
Como melhorar a qualidade do seu conjunto de dados

E aqui vai uma pergunta ainda mais sugestiva:

Tente adivinhar: em seu projeto de machine learning, quanto tempo você normalmente gasta com preparação e transformação de dados?
Menos da metade do tempo do projeto
Mais da metade do tempo do projeto

Neste módulo, você vai saber mais sobre as características do machine learning conjuntos de dados e como prepará-los para garantir resultados de alta qualidade ao para treinar e avaliar seu modelo.