Implementare un modello

Quando implementi un modello, inizia con semplicità. La maggior parte del lavoro nel machine learning viene svolta dal lato dati, perciò l'esecuzione di una pipeline completa per un modello complesso è più difficile che eseguire l'iterazione sul modello stesso. Dopo aver configurato la pipeline di dati e aver implementato un modello semplice che utilizza alcune caratteristiche, puoi eseguire l'iterazione per creare un modello migliore.

I modelli semplici sono una buona base di riferimento, anche se alla fine non hai intenzione di lanciarli. Infatti, utilizzare un modello semplice probabilmente è meglio di quanto pensi. Iniziare in modo semplice aiuta a determinare se un modello complesso è giustificato o meno.

Addestra il tuo modello rispetto all'utilizzo di un modello già addestrato

I modelli addestrati sono disponibili per vari casi d'uso e offrono numerosi vantaggi. Tuttavia, i modelli addestrati funzionano davvero solo quando l'etichetta e le caratteristiche corrispondono esattamente al set di dati. Ad esempio, se un modello addestrato utilizza 25 caratteristiche e il tuo set di dati ne include solo 24, è molto probabile che il modello addestrato faccia previsioni errate.

Di solito, i professionisti del machine learning usano sottosezioni corrispondenti degli input di un modello addestrato per il perfezionamento o il Transfer Learning. Se non esiste un modello addestrato per il tuo caso d'uso particolare, ti consigliamo di utilizzare le sottosezioni di un modello addestrato per addestrare il tuo modello.

Per informazioni sui modelli addestrati, consulta

Monitoraggio

Durante l'elaborazione dei problemi, considera l'infrastruttura di monitoraggio e avviso di cui ha bisogno la tua soluzione ML.

Deployment del modello

In alcuni casi, un modello appena addestrato potrebbe essere peggiore di quello attualmente in produzione. Se lo è, vorrai evitare che venga rilasciato in produzione e ricevere un avviso che ti informa che il deployment automatico non è riuscito.

Disallineamento addestramento/distribuzione

Se una qualsiasi delle caratteristiche in entrata utilizzate per l'inferenza ha valori che non rientrano nell'intervallo di distribuzione dei dati utilizzati in addestramento, ti consigliamo di ricevere un avviso perché è probabile che il modello faccia previsioni scadenti. Ad esempio, se il tuo modello è stato addestrato per prevedere temperature per le città equatoriali a livello del mare, il tuo sistema di pubblicazione dovrebbe avvisarti dei dati in arrivo con latitudini e longitudini e/o altitudini al di fuori dell'intervallo su cui il modello è stato addestrato. Al contrario, il sistema di pubblicazione dovrebbe avvisarti se il modello effettua previsioni al di fuori dell'intervallo di distribuzione rilevato durante l'addestramento.

Server di inferenza

Se fornisci inferenze tramite un sistema RPC, ti consigliamo di monitorare il server RPC e di ricevere un avviso se smette di fornire inferenze.