Set di convalida: verifica l'intuito

Prima di iniziare questo modulo, valuta se sono presenti eventuali insidie nell'utilizzo del processo di addestramento descritto in Set di addestramento e test.

Esplora le opzioni riportate di seguito.

Abbiamo esaminato il processo di utilizzo di un set di test e di un set di addestramento per favorire le iterazioni dello sviluppo di modelli. A ogni iterazione, addestrevamo i dati di addestramento e la valutavamo in base ai dati di test, utilizzando i risultati della valutazione sui dati di test per orientare la scelta e le modifiche ai vari iperparametri del modello, come tasso di apprendimento e funzionalità. C'è qualcosa che non va in questo approccio? Seleziona una sola risposta.
Bene, stiamo addestrando i dati di addestramento e valutandoli su dati di test separati e non resi disponibili.
C'è un problema sottile qui. Pensa a cosa potrebbe accadere se eseguissimo molte, molte iterazioni di questo modulo.
Eseguire molti cicli di questa procedura potrebbe farci adattarci implicitamente alle peculiarità del nostro set di test specifico.
Sì! Più spesso valutiamo su un determinato set di test, più rischiamo di sovrapporre implicitamente a quel singolo set di test. Esamineremo un protocollo migliore.
Questa operazione non è efficiente dal punto di vista computazionale. Dobbiamo solo scegliere un insieme predefinito di iperparametri e continuare a utilizzarli per risparmiare risorse.
Sebbene questi tipi di iterazioni siano costose, sono una parte fondamentale dello sviluppo dei modelli. Le impostazioni degli iperparametri possono fare un'enorme differenza in termini di qualità del modello e dobbiamo sempre prevedere il tempo e le risorse di calcolo per assicurarci di ottenere la migliore qualità possibile.