Em termos gerais, há duas maneiras de treinar um modelo:
Um modelo estático é treinado off-line. Ou seja, treinamos o modelo exatamente
uma vez e usamos esse modelo treinado por um tempo.
Um modelo dinâmico é treinado on-line. Ou seja, os dados entram continuamente no sistema e os incorporamos ao modelo por meio de atualizações contínuas.
Treinamento estático x dinâmico
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Modelo dinâmico: treinado on-line
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
Modelo dinâmico: treinado on-line
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
Ainda requer monitoramento de entradas
Modelo dinâmico: treinado on-line
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
Ainda requer monitoramento de entradas
É fácil deixar isso ficar desatualizado
Modelo dinâmico: treinado on-line
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
Ainda requer monitoramento de entradas
É fácil deixar isso ficar desatualizado
Modelo dinâmico: treinado on-line
Continue alimentando os dados de treinamento ao longo do tempo e sincronize regularmente a versão atualizada.
Use a validação progressiva em vez de treinamento e teste em lote.
Paradigmas do sistema de ML: treinamento
Modelo estático - treinado off-line
Fácil de criar e testar. Use treinamento e teste em lote, itere até ficar bom.
Ainda requer monitoramento de entradas
É fácil deixar isso ficar desatualizado
Modelo dinâmico: treinado on-line
Continue alimentando os dados de treinamento ao longo do tempo e sincronize regularmente a versão atualizada.
Use a validação progressiva em vez de treinamento e teste em lote
Precisa de recursos de monitoramento, reversão de modelo e quarentena de dados
Adapta-se às mudanças, evitando problemas de inatividade
Resumo da aula em vídeo
De um modo geral, os seguintes pontos dominam a decisão de treinamento estático versus dinâmico:
Os modelos estáticos são mais fáceis de criar e testar.
Os modelos dinâmicos se adaptam às mudanças de dados.
O mundo é um lugar altamente mutável. É improvável que as previsões de vendas criadas com base nos dados do ano passado sejam bem-sucedidas na previsão dos resultados do próximo ano.
Se o conjunto de dados realmente não muda com o tempo, escolha o treinamento estático,
porque é mais barato de criar e manter do que o treinamento dinâmico.
No entanto, muitas fontes de informações realmente mudam com o tempo, mesmo aquelas com
recursos que você considera tão constantes quanto, por exemplo, o nível do mar.
Moral: mesmo com treinamento estático, você ainda precisa monitorar a mudança dos dados de entrada.
Por exemplo, considere um modelo treinado para prever a probabilidade de os usuários comprarem flores. Devido à pressão de tempo, o modelo é treinado apenas uma vez, usando um conjunto de dados do comportamento de compra de flores durante julho e agosto.
Em seguida, o modelo é enviado para exibir previsões em produção, mas nunca é atualizado. O modelo funciona bem por vários meses, mas faz previsões terríveis perto do Dia dos Namorados porque o comportamento do usuário durante esse período muda drasticamente.