Quando implementi un modello, inizia in modo semplice. La maggior parte del lavoro nel ML si basa sui dati quindi eseguire una pipeline completa per un modello complesso è più difficile eseguire l'iterazione del modello stesso. Dopo aver configurato la pipeline di dati implementando un modello semplice che utilizza alcune caratteristiche, è possibile per creare un modello migliore.
I modelli semplici forniscono una buona base di riferimento, anche se non finisci per lanciarli. In effetti, l'utilizzo di un modello semplice è probabilmente migliore di quanto pensi. Iniziare dalla semplicità aiuta a determinare se un modello complesso è giustificato.
Addestra il tuo modello anziché utilizzare un modello già addestrato
I modelli addestrati esistono per una varietà di casi d'uso e offrono e i vantaggi che offre. Tuttavia, i modelli addestrati funzionano davvero solo quando l'etichetta che corrispondano esattamente al set di dati. Ad esempio, se un modello addestrato utilizza 25 caratteristiche e il set di dati ne include solo 24, le caratteristiche molto probabilmente farà previsioni errate.
Di solito, i professionisti di ML utilizzano sottosezioni di input corrispondenti addestrato per l'ottimizzazione o il Transfer Learning. Se un modello addestrato non esiste per il tuo caso d'uso particolare, considera utilizzando le sottosezioni di un modello addestrato durante l'addestramento di uno proprio.
Per informazioni sui modelli addestrati, consulta
Monitoraggio
Durante l'inquadratura dei problemi, considera l'infrastruttura di monitoraggio e avviso le esigenze delle soluzioni di ML.
Deployment del modello
In alcuni casi, un modello appena addestrato potrebbe essere peggiore di quello attualmente in e produzione. In questo caso, dovrai evitare che venga rilasciato produzione e riceverai un avviso che indica che il deployment automatico non è riuscito.
Disallineamento addestramento/distribuzione
Se una qualsiasi delle caratteristiche in entrata utilizzate per l'inferenza ha valori che non rientrano l'intervallo di distribuzione dei dati usati nell'addestramento, vorrai ricevere un avviso perché è probabile che il modello faccia previsioni errate. Ad esempio, se addestrato per prevedere le temperature delle città equatoriali sul livello del mare, il sistema di pubblicazione dovrebbe avvisarti dei dati in arrivo con latitudine e longitudini e/o altitudini al di fuori dell'intervallo su cui è stato addestrato il modello. Al contrario, il sistema di pubblicazione dovrebbe avvisarti se il modello sta previsioni che non rientrano nell'intervallo di distribuzione visualizzato durante addestramento.
Server di inferenza
Se fornisci inferenze tramite un sistema RPC, ti consigliamo di monitorare allo stesso server RPC e ricevi un avviso se smette di fornire inferenze.