Pon a prueba tus conocimientos sobre los sistemas del AA de producción

  1. Estás usando aprendizaje automático para compilar un modelo de clasificación que predice la apariencia de los unicornios. Tu conjunto de datos detalla 10,000 apariciones de unicornio y 10,000 no apariciones de unicornio. El conjunto de datos contiene la ubicación, la hora del día, la elevación, la temperatura, la humedad, la cobertura arbórea, la presencia de arcoíris y muchos otros atributos.

    Después de iniciar el predictor de apariencia de unicornio, deberás mantener actualizado tu modelo. Para ello, deberás volver a entrenarlo con datos nuevos. Debido a que estás recopilando demasiados datos nuevos para entrenar, decides limitar los datos de entrenamiento mediante el muestreo de los datos nuevos durante un período. También debes tener en cuenta los patrones diarios y anuales de las apariencias de unicornio. ¿Qué período eliges?

  2. Inicias el predictor de la apariencia de unicornio. ¡Funciona bien! Te vas de vacaciones y regresas después de tres semanas, y descubres que la calidad de tu modelo disminuyó de manera significativa. Supongamos que es poco probable que el comportamiento unicornio cambie de manera significativa en tres semanas. ¿Cuál es la explicación más probable de la disminución en la calidad?

  3. Revisas las predicciones del modelo para la Antártida y descubres que el modelo ha estado haciendo predicciones deficientes allí desde que se lanzó a producción. ¿Cuál de las siguientes opciones podría ser la fuente del problema?

  4. El predictor de la apariencia de tu unicornio funcionó durante un año. Ya corregiste muchos problemas, y ahora la calidad es alta. Sin embargo, observas un problema pequeño, pero persistente. La calidad de tu modelo es un poco más baja en las áreas urbanas. ¿Cuál podría ser la causa?

  5. A través de todos los pasos de solución de problemas, mejoraste considerablemente la calidad de las predicciones del modelo unicornio y, como resultado, el uso se multiplicó por diez. Sin embargo, los usuarios ahora se quejan de que el modelo es extremadamente lento. las solicitudes de inferencia suelen tardar más de 30 segundos en devolver predicciones. ¿Cuál de los siguientes cambios podría ayudar a resolver este problema?