Sistemas de AA de producción: Entrenamiento estático versus dinámico

En términos generales, puedes entrenar un modelo de dos maneras:

  • Entrenamiento estático (también llamado entrenamiento sin conexión) significa que entrenas un modelo una sola vez. Luego, entregas ese mismo modelo entrenado por un tiempo.
  • Entrenamiento dinámico (también llamado entrenamiento en línea) significa que entrenas un modelo de forma continua o al menos con frecuencia. Sueles publicar más modelo recién entrenado.
Figura 2: La masa cruda crea tres barras de pan idénticas.
Figura 2: Entrenamiento estático Entrenar una vez entregar el mismo modelo de compilación varias veces. (Imágenes de Pexels y de fancycrave1).

 

Figura 3: La masa cruda crea hogazas de pan ligeramente diferentes
            cada vez.
Figura 3: Entrenamiento dinámico Vuelve a entrenar con frecuencia. publicar más modelo recién compilado. (Imágenes de Pexels y de Couleur).

 

Tabla 1: Ventajas y desventajas principales

Entrenamiento estático Entrenamiento dinámico
Ventajas Más simple. Solo debes desarrollar y probar el modelo una vez. Más adaptable. Tu modelo cumplirá con todas las cambios en la relación entre atributos y etiquetas.
Desventajas A veces más lento. Si la relación entre los atributos y las etiquetas cambian con el tiempo, las predicciones de tu modelo se degradarán. Más trabajo Debes compilar, probar y lanzar un producto nuevo todo el tiempo.

Si tu conjunto de datos no cambia con el tiempo, elige el entrenamiento estático porque es más económico crear y mantener que el entrenamiento dinámico. Sin embargo, los conjuntos de datos tienden a cambiar con el tiempo, incluso aquellos con funciones que crees constante como, por ejemplo, el nivel del mar. Conclusión: incluso con entrenamiento, de todas formas debes supervisar los datos de entrada para detectar cambios.

Por ejemplo, considera un modelo entrenado para predecir la probabilidad de que los usuarios comprará flores. Debido a la presión del tiempo, el modelo se entrena una sola vez mediante un conjunto de datos sobre el comportamiento de compra de flores durante julio y agosto. El modelo funciona bien durante varios meses, pero luego realiza predicciones pésimas. para el Día de San Valentín porque el comportamiento de los usuarios durante ese período de festividades cambió drásticamente.

Para explorar en detalle el entrenamiento estático y dinámico, consulta el Administración de proyectos de AA en este curso.

Ejercicios: Verifica tus conocimientos

¿Cuáles son las dos afirmaciones verdaderas sobre entrenamiento estático (sin conexión)?
El modelo se mantiene actualizado a medida que llegan nuevos datos.
En realidad, si entrenas sin conexión, el modelo no tiene forma de incorporar datos nuevos a medida que llegan. Esto puede dar lugar a un modelo obsolescencia, si la distribución de la que intentas aprender cambian con el tiempo.
Puedes verificar el modelo antes de aplicarlo en producción.
Sí, el entrenamiento sin conexión ofrece una gran oportunidad para verificar el modelo el rendimiento antes de presentar el modelo en producción.
El entrenamiento sin conexión requiere menos supervisión de los trabajos de entrenamiento. que la capacitación en línea.
En general, los requisitos de supervisión durante el entrenamiento son más bajos para el entrenamiento sin conexión, lo que te aísla de muchos entornos y consideraciones clave. Sin embargo, cuanto más frecuentemente entrenes el modelo, mayor será la inversión que se necesita para supervisar. Deberás validar con regularidad para garantizar que los cambios en tu código (y sus dependencias) no afectan negativamente la calidad del modelo.
Se debe realizar muy poca supervisión de los datos de entrada al tiempo de inferencia.
De manera contradictoria, debes supervisar los datos de entrada en la entrega tiempo. Si las distribuciones de entrada cambian, entonces las predicciones pueden volverse poco confiables. Imagina, por ejemplo, un modelo se entrenan solo con datos de ropa de verano que de repente se usan predecir el comportamiento de compra de ropa en invierno.
¿Cuál de las siguientes afirmaciones es verdadera? el entrenamiento dinámico (en línea)?
El modelo se mantiene actualizado a medida que llegan nuevos datos.
Este es el principal beneficio de la capacitación en línea. puedes evitar muchas y los problemas de obsolescencia permitiendo que el modelo se entrene con datos nuevos en la que entra.
Se debe realizar muy poca supervisión de los trabajos de entrenamiento.
En realidad, debe supervisar los trabajos de entrenamiento de forma continua de que están saludables y funcionan según lo previsto. También necesitarás infraestructura de respaldo, como la capacidad de revertir un modelo a una instantánea anterior en caso de que algo salga mal en el entrenamiento. como un trabajo con errores o una corrupción en los datos de entrada.
Se debe realizar muy poca supervisión de los datos de entrada al tiempo de inferencia.
Al igual que con un modelo estático sin conexión, también es importante supervisar las entradas a los modelos actualizados de forma dinámica. Eres no corren riesgo de grandes efectos estacionales, pero grandes cambios en las entradas (como una fuente de datos ascendente puede causar predicciones poco confiables.