Set di dati, generalizzazione e overfitting

Introduzione

Questo modulo inizia con una domanda principale. Scegli una delle seguenti risposte:

Se dovessi dare la priorità al miglioramento di una delle seguenti aree nel tuo progetto di machine learning, che avrebbe il massimo impatto?
Applicazione di una funzione di perdita più intelligente all'addestramento del modello
Migliorare la qualità del set di dati

Ed ecco una domanda ancora più insistente:

Indovina: nel tuo progetto di machine learning, quanto tempo in genere investi nella preparazione e nella trasformazione dei dati?
Meno di metà delle ore di utilizzo del progetto
Più di metà delle ore di utilizzo del progetto

In questo modulo scoprirai di più sulle caratteristiche del machine learning set di dati e come prepararli per garantire risultati di alta qualità per l'addestramento e la valutazione del modello.