Sistemas de AA de producción: Entrenamiento estático versus dinámico
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
En términos generales, puedes entrenar un modelo de dos maneras:
El entrenamiento estático (también llamado entrenamiento sin conexión) significa que entrenas un modelo solo una vez. Luego, puedes entregar ese mismo modelo entrenado durante un tiempo.
El entrenamiento dinámico (también llamado entrenamiento en línea) significa que entrenas un modelo de forma continua o, al menos, con frecuencia. Por lo general, se entrega el modelo más
recién entrenado.
Figura 2: Entrenamiento estático Entrena una vez y publica el mismo modelo compilado
varias veces. (Imágenes de Pexels y fancycrave1).
Figura 3: Entrenamiento dinámico Vuelve a entrenar con frecuencia y entrega el
modelo compilado más reciente. (Imágenes de Pexels y Couleur).
Tabla 1: Ventajas y desventajas principales.
Entrenamiento estático
Entrenamiento dinámico
Ventajas
Más simple. Solo debes desarrollar y probar el modelo una vez.
Más adaptable. Tu modelo se mantendrá al día con cualquier
cambio en la relación entre los atributos y las etiquetas.
Desventajas
A veces, más inactivos. Si la relación entre los atributos y las etiquetas cambia con el tiempo, las predicciones de tu modelo se degradarán.
Más trabajo. Debes compilar, probar y lanzar un producto nuevo
todo el tiempo.
Si tu conjunto de datos realmente no cambia con el tiempo, elige el entrenamiento estático, ya que es más económico crearlo y mantenerlo que el entrenamiento dinámico. Sin embargo, los conjuntos de datos suelen cambiar con el tiempo, incluso aquellos con atributos que crees que son tan constantes como, por ejemplo, el nivel del mar. Conclusión: Incluso con el entrenamiento estático, debes supervisar los datos de entrada en busca de cambios.
Por ejemplo, considera un modelo entrenado para predecir la probabilidad de que los usuarios comprarán flores. Debido a la presión del tiempo, el modelo se entrena solo una vez con un conjunto de datos del comportamiento de compra de flores durante julio y agosto.
El modelo funciona bien durante varios meses, pero luego hace predicciones terribles alrededor del Día de San Valentín porque el comportamiento de los usuarios durante ese período de festividades florales cambia de forma drástica.
¿Cuáles de las siguientes afirmaciones son verdaderas sobre el entrenamiento estático (sin conexión)?
El modelo se mantiene actualizado a medida que ingresan datos nuevos.
En realidad, si entrenas sin conexión, el modelo no tiene forma de incorporar datos nuevos a medida que ingresan. Esto puede provocar que el modelo se desactualice si la distribución de la que intentas aprender cambia con el tiempo.
Puedes verificar el modelo antes de aplicarlo en producción.
Sí, el entrenamiento sin conexión ofrece una gran oportunidad para verificar el rendimiento del modelo antes de incorporarlo en producción.
El entrenamiento sin conexión requiere menos supervisión de los trabajos de entrenamiento que el entrenamiento en línea.
En general, los requisitos de supervisión en el momento del entrenamiento son más simples para el entrenamiento sin conexión, lo cual te protege de muchas consideraciones de producción. Sin embargo, cuanto más frecuentemente entrenes tu modelo,
mayor será la inversión que deberás realizar en la supervisión. También querrás validar con frecuencia para asegurarte de que los cambios en tu código (y sus dependencias) no afecten negativamente la calidad del modelo.
Se debe realizar muy poca supervisión de los datos de entrada en el momento de la inferencia.
Contrario a lo que se podría pensar, sí debes supervisar los datos de entrada durante el tiempo de publicación. Si cambian las distribuciones de entrada, es posible que las predicciones de nuestro
modelo no sean confiables. Imagina, por ejemplo, un modelo que se entrenó solo con datos de ropa de verano que, de repente, se usa para predecir el comportamiento de compra de ropa en invierno.
¿Cuál de las siguientes afirmaciones es verdadera sobre el entrenamiento dinámico (en línea)?
El modelo se mantiene actualizado a medida que ingresan datos nuevos.
Este es el beneficio principal del entrenamiento en línea. Puedes evitar muchos problemas de inactividad si permites que el modelo entrene con datos nuevos a medida que llegan.
Se debe realizar muy poca supervisión de los trabajos de entrenamiento.
En realidad, debes supervisar los trabajos de entrenamiento de forma continua para asegurarte de que funcionen correctamente. También necesitarás una infraestructura de asistencia, como la capacidad de revertir un modelo a una instantánea anterior en caso de que algo salga mal en el entrenamiento, como un trabajo con errores o una corrupción en los datos de entrada.
Se debe realizar muy poca supervisión de los datos de entrada en el momento de la inferencia.
Al igual que con un modelo estático sin conexión, también es importante supervisar las entradas de los modelos que se actualizan de forma dinámica. Es probable que no exista un riesgo de efectos estacionales importantes, pero los cambios grandes y repentinos de las entradas (como una fuente de datos superior que pasa a ser inferior) pueden causar predicciones poco confiables.
[null,null,["Última actualización: 2025-07-27 (UTC)"],[[["\u003cp\u003eMachine learning models can be trained statically (once) or dynamically (continuously).\u003c/p\u003e\n"],["\u003cp\u003eStatic training is simpler but can become outdated if data patterns change, requiring data monitoring.\u003c/p\u003e\n"],["\u003cp\u003eDynamic training adapts to new data, providing more accurate predictions but demands more resources and monitoring.\u003c/p\u003e\n"],["\u003cp\u003eChoosing between static and dynamic training depends on the specific dataset and how frequently it changes.\u003c/p\u003e\n"],["\u003cp\u003eMonitoring input data is essential for both static and dynamic training to ensure reliable predictions.\u003c/p\u003e\n"]]],[],null,["# Production ML systems: Static versus dynamic training\n\nBroadly speaking, you can train a model in either of two ways:\n\n- [**Static training**](/machine-learning/glossary#static) (also called **offline training**) means that you train a model only once. You then serve that same trained model for a while.\n- [**Dynamic training**](/machine-learning/glossary#dynamic) (also called **online training**) means that you train a model continuously or at least frequently. You usually serve the most recently trained model.\n\n**Figure 2.** Static training. Train once; serve the same built model multiple times. (Images by Pexels and by fancycrave1.)\n\n**Figure 3.** Dynamic training. Retrain frequently; serve the most recently built model. (Images by Pexels and by Couleur.)\n\n**Table 1.** Primary advantages and disadvantages.\n\n| | Static training | Dynamic training |\n| Advantages | **Simpler.** You only need to develop and test the model once. | **More adaptable.** Your model will keep up with any changes to the relationship between features and labels. |\n| Disadvantages | **Sometimes staler.** If the relationship between features and labels changes over time, your model's predictions will degrade. | **More work.** You must build, test, and release a new product all the time. |\n|---------------|---------------------------------------------------------------------------------------------------------------------------------|---------------------------------------------------------------------------------------------------------------|\n\nIf your dataset truly isn't changing over time, choose static training because\nit is cheaper to create and maintain than dynamic training. However, datasets\ntend to change over time, even those with features that you think are as\nconstant as, say, sea level. The takeaway: even with static\ntraining, you must still monitor your input data for change.\n\nFor example, consider a model trained to predict the probability that users\nwill buy flowers. Because of time pressure, the model is trained only once\nusing a dataset of flower buying behavior during July and August.\nThe model works fine for several months but then makes terrible predictions\naround [Valentine's Day](https://wikipedia.org/wiki/Valentine's_Day) because\nuser behavior during that floral holiday period changes dramatically.\n\nFor a more detailed exploration of static and dynamic training, see the\n[Managing ML Projects](/machine-learning/managing-ml-projects/pipelines)\ncourse.\n\nExercises: Check your understanding\n-----------------------------------\n\nWhich **two** of the following statements are true about static (offline) training? \nThe model stays up to date as new data arrives. \nActually, if you train offline, then the model has no way to incorporate new data as it arrives. This can lead to model staleness, if the distribution you are trying to learn from changes over time. \nYou can verify the model before applying it in production. \nYes, offline training gives ample opportunity to verify model performance before introducing the model in production. \nOffline training requires less monitoring of training jobs than online training. \nIn general, monitoring requirements at training time are more modest for offline training, which insulates you from many production considerations. However, the more frequently you train your model, the higher the investment you'll need to make in monitoring. You'll also want to validate regularly to ensure that changes to your code (and its dependencies) don't adversely affect model quality. \nVery little monitoring of input data needs to be done at inference time. \nCounterintuitively, you do need to monitor input data at serving time. If the input distributions change, then our model's predictions may become unreliable. Imagine, for example, a model trained only on summertime clothing data suddenly being used to predict clothing buying behavior in wintertime. \nWhich **one** of the following statements is true of dynamic (online) training? \nThe model stays up to date as new data arrives. \nThis is the primary benefit of online training; you can avoid many staleness issues by allowing the model to train on new data as it comes in. \nVery little monitoring of training jobs needs to be done. \nActually, you must continuously monitor training jobs to ensure that they are healthy and working as intended. You'll also need supporting infrastructure like the ability to roll a model back to a previous snapshot in case something goes wrong in training, such as a buggy job or corruption in input data. \nVery little monitoring of input data needs to be done at inference time. \nJust like a static, offline model, it is also important to monitor the inputs to the dynamically updated models. You are likely not at risk for large seasonality effects, but sudden, large changes to inputs (such as an upstream data source going down) can still cause unreliable predictions.\n| **Key terms:**\n|\n| - [Dynamic training](/machine-learning/glossary#dynamic)\n- [Static training](/machine-learning/glossary#static) \n[Help Center](https://support.google.com/machinelearningeducation)"]]