Se stai avviando un nuovo progetto di machine learning (ML), potresti chiederti se l'addestramento manuale è l'unica opzione per creare un modello di machine learning. Con all'addestramento manuale, scrivi il codice usando un framework ML per creare un modello. Durante questo processo, si sceglie quali algoritmi esplorare e ottimizzare iterativamente iperparametri per trovare il modello giusto.
Naturalmente, l'addestramento del modello non è l'unica cosa a cui devi pensare. Nella sulla creazione di un modello di machine learning dal prototipo alla produzione comporta attività ripetitive e competenze specialistiche. Un semplice ML esplorativo un flusso di lavoro simile al seguente:
Attività ripetitive: il flusso di lavoro di ML può comportare sperimentazione e lavoro ripetitivo. Ad esempio, durante lo sviluppo del modello in genere è necessario esplorare diverse combinazioni di algoritmi e iperparametri per identificare il modello più appropriato. Con l'addestramento manuale, scrivi codice specializzato per addestrare il modello e poi lo modifichi per eseguire esperimenti con diversi algoritmi di ML e iperparametri al fine di trovare il modello migliore. Per progetti piccoli o esplorativi, questa procedura manuale potrebbe non essere un problema, ma per progetti più grandi queste attività ripetitive possono richiedere molto tempo.
Competenze specializzate: lo sviluppo manuale di un modello ML richiede competenze specializzate. In pratica, non tutti i team che intendono sviluppare un modello di machine learning potrebbero possedere queste competenze. Se un team non dispone di un data scientist dedicato, manualmente potrebbero non essere eseguibili.
Fortunatamente, alcuni passaggi nello sviluppo del modello possono essere automatizzati per ridurre il carico di lavoro ripetitivo e la necessità di competenze specialistiche. Automatizzare questi elementi è l'oggetto di questo modulo sul machine learning automatizzato (AutoML).
Che cos'è AutoML?
AutoML è un processo di automazione di determinate attività in un flusso di lavoro di machine learning. Puoi considerare AutoML come un insieme di strumenti e tecnologie che rendono la creazione di modelli di machine learning più rapida e accessibile a un gruppo più ampio di utenti. Sebbene l'automazione possa aiutare durante il flusso di lavoro ML, le attività associate ad AutoML sono quelle incluse nel ciclo di sviluppo dei modelli come mostrato nella Figura 1. Queste attività ripetitive includono:
- Data engineering
- Feature engineering.
- Selezione delle funzionalità.
- Formazione
- Identificare un algoritmo ML appropriato.
- Selezionare gli iperparametri migliori.
- Analisi
- Valutazione delle metriche generate durante l'addestramento in base ai set di dati di test e di convalida.
Con AutoML, puoi concentrarti sul tuo problema di ML e sui dati anziché sulle caratteristiche selezione, ottimizzazione degli iperparametri e scelta dell'algoritmo giusto.