Set di convalida: altra partizione

Il modulo precedente ha introdotto il partizionamento di un set di dati in un set di addestramento e in un set di test. Questo partizionamento ha permesso di addestrare un insieme di esempi e quindi di testare il modello rispetto a un altro insieme di esempi. Con due partizioni, il flusso di lavoro potrebbe essere:

Diagramma del flusso di lavoro costituito da tre fasi. 1. Addestra il modello sul set di addestramento. 2. Valuta il modello su un set di test. 3. Modifica il modello in base ai risultati nel set di test. Ripeti i passaggi con 1, 2 e 3, scegliendo il modello che fa meglio sul set di test.

Figura 1. Un flusso di lavoro possibile?

Nella figura, "Modifica modello" significa modificare qualsiasi aspetto del modello che puoi immaginare, dalla modifica del tasso di apprendimento, all'aggiunta o rimozione di caratteristiche, alla progettazione di un modello completamente nuovo da zero. Al termine di questo flusso di lavoro, scegli il modello con il miglior rendimento nel set di test.

Suddividere il set di dati in due insiemi è una buona idea, ma non una panacea. Puoi ridurre notevolmente le probabilità di overfitting partizionando il set di dati nei tre sottoinsiemi mostrati nella figura seguente:

Una barra orizzontale divisa in tre parti: il 70% è il set di addestramento, il 15% il set di convalida e il 15% il set di test.

Figura 2. Suddividere un singolo set di dati in tre sottoinsiemi.

Utilizza il set di convalida per valutare i risultati del set di addestramento. Quindi, utilizza il set di test per verificare la valutazione dopo che il modello ha "superato" il set di convalida. La figura seguente mostra questo nuovo flusso di lavoro:

Flusso di lavoro simile alla Figura 1, con la differenza che, invece di valutare il modello rispetto al set di test, il flusso di lavoro valuta il modello rispetto al set di convalida. Quindi, una volta che il set di addestramento e il set di convalida sono più o meno d'accordo, conferma il modello rispetto al set di test.

Figura 3. Un flusso di lavoro migliore.

In questo flusso di lavoro migliorato:

  1. Scegli il modello con il miglior rendimento nel set di convalida.
  2. Verifica il modello rispetto al set di test.

Si tratta di un flusso di lavoro migliore perché crea meno esposizioni per il set di test.