Sistemas de ML de produção: teste seu conhecimento

  1. Você está usando machine learning para criar um modelo de classificação que prevê a aparência de unicórnios. Seu conjunto de dados detalha 10.000 aparições e 10.000 aparições de unicórnios. O conjunto de dados contém o local, a hora do dia, a elevação, a temperatura, umidade, a cobertura de árvores, a presença de um arco-íris e vários outros atributos.

    Depois de lançar o preditor de aparência de unicórnio, você precisará treinar novamente seu modelo com novos dados. Como você está reunindo muitos dados novos para treinar, você decide limitar os dados de treinamento fazendo uma amostragem dos novos dados ao longo de uma janela de tempo. Você também precisa considerar os padrões diários e anuais nas aparições de unicórnios. Qual janela de tempo você escolhe?

  2. Você inicia o preditor de aparência do unicórnio. Está funcionando bem! Você sai de férias e volta após três semanas para descobrir que a qualidade do seu modelo caiu significativamente. Suponha que é improvável que o comportamento do unicórnio mude significativamente em três semanas. Qual é a explicação mais provável para a queda na qualidade?

  3. Depois de analisar as previsões do modelo para a Antártida, você descobre que ele tem feito previsões ruins na região desde que foi lançado para produção. Qual das opções a seguir poderia ser a fonte do problema?

  4. Seu preditor de aparência de unicórnio está funcionando há um ano. Você corrigiu muitos problemas, e a qualidade agora é alta. No entanto, você nota um problema pequeno, mas persistente. A qualidade do seu modelo diminuiu um pouco em áreas urbanas. Qual pode ser a causa?

  5. Com toda a solução de problemas, você melhorou bastante a qualidade das previsões do modelo unicórnio e, como resultado, o uso aumentou dez vezes. No entanto, os usuários estão reclamando que o modelo é extremamente lento. as solicitações de inferência geralmente levam mais de 30 segundos para retornar previsões. Qual das seguintes mudanças pode ajudar a resolver esse problema?