Sfruttare modelli preaddestrati
Addestrare una rete neurale convoluzionale per eseguire attività di classificazione delle immagini richiede in genere una quantità estremamente elevata di dati di addestramento e può richiedere molto tempo, il completamento di giorni o anche settimane. E se potessi sfruttare i modelli di immagini esistenti addestrati su enormi set di dati, come tramite TensorFlow-Slim, e adattarli per essere utilizzati nelle tue attività di classificazione?
Una tecnica comune per sfruttare i modelli preaddestrati è l'estrazione di caratteristiche: il recupero di rappresentazioni intermedie prodotte dal modello preaddestrato, quindi il passaggio di tali rappresentazioni in un nuovo modello come input. Ad esempio, se stai addestrando un modello di classificazione delle immagini per distinguere diversi tipi di verdure, potresti feed di immagini di addestramento di carote, sedano e così via in un modello preaddestrato, quindi estrarre le caratteristiche dal livello finale di convoluzione, che acquisisce tutte le informazioni che il modello ha appreso sulle immagini. Ulteriori attributi, vengono aggiunti al livello successivo, poi Per migliorare le prestazioni quando si utilizza l'estrazione delle funzionalità con un modello preaddestrato, gli ingegneri spesso perfezionano i parametri di peso applicati alle funzionalità estratte.
Per un'esplorazione più approfondita dell'estrazione delle funzionalità e della messa a punto quando utilizzi modelli preaddestrati, consulta il seguente esercizio.