Sistemas de AA de producción: Entrenamiento estático versus dinámico
En términos generales, puedes entrenar un modelo de dos maneras:
Entrenamiento estático (también
llamado entrenamiento sin conexión) significa que entrenas un modelo
una sola vez. Luego, entregas ese mismo modelo entrenado por un tiempo.
Entrenamiento dinámico (también
llamado entrenamiento en línea) significa que entrenas un modelo
de forma continua o al menos con frecuencia. Sueles publicar más
modelo recién entrenado.
Tabla 1: Ventajas y desventajas principales
Entrenamiento estático
Entrenamiento dinámico
Ventajas
Más simple. Solo debes desarrollar y probar el modelo una vez.
Más adaptable. Tu modelo cumplirá con todas las
cambios en la relación entre atributos y etiquetas.
Desventajas
A veces más lento. Si la relación entre los atributos y
las etiquetas cambian con el tiempo, las predicciones de tu modelo se degradarán.
Más trabajo Debes compilar, probar y lanzar un producto nuevo
todo el tiempo.
Si tu conjunto de datos no cambia con el tiempo, elige el entrenamiento estático porque
es más económico crear y mantener que el entrenamiento dinámico. Sin embargo, los conjuntos de datos
tienden a cambiar con el tiempo, incluso aquellos con funciones que crees
constante como, por ejemplo, el nivel del mar. Conclusión: incluso con
entrenamiento, de todas formas debes supervisar los datos de entrada para detectar cambios.
Por ejemplo, considera un modelo entrenado para predecir la probabilidad de que los usuarios
comprará flores. Debido a la presión del tiempo, el modelo se entrena una sola vez
mediante un conjunto de datos sobre el comportamiento de compra de flores durante julio y agosto.
El modelo funciona bien durante varios meses, pero luego realiza predicciones pésimas.
para el Día de San Valentín porque
el comportamiento de los usuarios
durante ese período de festividades cambió drásticamente.
¿Cuáles son las dos afirmaciones verdaderas sobre
entrenamiento estático (sin conexión)?
El modelo se mantiene actualizado a medida que llegan nuevos datos.
En realidad, si entrenas sin conexión, el modelo no tiene forma de
incorporar datos nuevos
a medida que llegan. Esto puede dar lugar a un modelo
obsolescencia, si la distribución de la que intentas aprender
cambian con el tiempo.
Puedes verificar el modelo antes de aplicarlo en producción.
Sí, el entrenamiento sin conexión ofrece una gran oportunidad para verificar el modelo
el rendimiento antes de presentar el modelo en producción.
El entrenamiento sin conexión requiere menos supervisión de los trabajos de entrenamiento.
que la capacitación en línea.
En general, los requisitos de supervisión durante el entrenamiento son más bajos
para el entrenamiento sin conexión, lo que te aísla de muchos entornos
y consideraciones clave. Sin embargo, cuanto más frecuentemente entrenes el modelo,
mayor será la inversión que se necesita para supervisar. Deberás
validar con regularidad para garantizar que los cambios en tu código
(y sus dependencias) no afectan negativamente la calidad del modelo.
Se debe realizar muy poca supervisión
de los datos de entrada al
tiempo de inferencia.
De manera contradictoria, debes supervisar los datos de entrada en la entrega
tiempo. Si las distribuciones de entrada cambian, entonces
las predicciones pueden volverse poco confiables. Imagina, por ejemplo, un modelo
se entrenan solo con datos de ropa
de verano que de repente se usan
predecir el comportamiento de compra de ropa en invierno.
¿Cuál de las siguientes afirmaciones es verdadera?
el entrenamiento dinámico (en línea)?
El modelo se mantiene actualizado a medida que llegan nuevos datos.
Este es el principal beneficio de la capacitación en línea. puedes evitar muchas
y los problemas de obsolescencia permitiendo que el modelo se entrene con datos nuevos
en la que entra.
Se debe realizar muy poca supervisión de los trabajos de entrenamiento.
En realidad, debe supervisar los trabajos
de entrenamiento de forma continua
de que están saludables y
funcionan según lo previsto. También necesitarás
infraestructura de respaldo, como la capacidad de revertir un modelo
a una instantánea anterior en caso
de que algo salga mal en el entrenamiento.
como un trabajo con errores
o una corrupción en los datos de entrada.
Se debe realizar muy poca supervisión
de los datos de entrada al
tiempo de inferencia.
Al igual que con un modelo estático sin conexión, también es importante
supervisar las entradas a los modelos actualizados de forma dinámica. Eres
no corren riesgo
de grandes efectos estacionales, pero
grandes cambios en las entradas (como una fuente de datos ascendente
puede causar predicciones poco confiables.