Cette page a été traduite par l'API Cloud Translation.

Entraînement statique et dynamique

De manière générale, il existe deux façons d'entraîner un modèle:

Un modèle statique est entraîné hors connexion. En d'autres termes, nous entraînons le modèle une seule fois puis nous l'utilisons pendant un certain temps.
Un modèle dynamique est entraîné en ligne. En d'autres termes, des données entrent en continu dans le système et nous les incorporons dans le modèle par le biais de mises à jour continues.

Entraînement statique et entraînement dynamique

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Modèle dynamique – Entraînement en ligne

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Faciles à créer et à tester : utilisez l'entraînement et les tests par lot, et effectuez des itérations jusqu'à ce que tout fonctionne correctement.

Modèle dynamique – Entraînement en ligne

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Faciles à créer et à tester : utilisez l'entraînement et les tests par lot, et effectuez des itérations jusqu'à ce que tout fonctionne correctement.
Nécessite toujours la surveillance des entrées

Modèle dynamique – Entraînement en ligne

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Faciles à créer et à tester : utilisez l'entraînement et les tests par lot, et effectuez des itérations jusqu'à ce que tout fonctionne correctement.
Nécessite toujours la surveillance des entrées
Il est facile de laisser cette période devenir obsolète.

Modèle dynamique – Entraînement en ligne

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Faciles à créer et à tester : utilisez l'entraînement et les tests par lot, et effectuez des itérations jusqu'à ce que tout fonctionne correctement.
Nécessite toujours la surveillance des entrées
Il est facile de laisser cette période devenir obsolète.

Modèle dynamique – Entraînement en ligne

continuer à alimenter les données d'entraînement au fil du temps et synchroniser régulièrement les versions mises à jour ;
Utilisez la validation progressive plutôt que l'entraînement et le test par lot.

Paradigmes du système de ML: entraînement

Modèle statique : entraînement hors connexion

Faciles à créer et à tester : utilisez l'entraînement et les tests par lot, et effectuez des itérations jusqu'à ce que tout fonctionne correctement.
Nécessite toujours la surveillance des entrées
Il est facile de laisser cette période devenir obsolète.

Modèle dynamique – Entraînement en ligne

continuer à alimenter les données d'entraînement au fil du temps et synchroniser régulièrement les versions mises à jour ;
Utiliser la validation progressive plutôt que l'entraînement et le test par lot
Nécessite des fonctionnalités de surveillance, de rollback du modèle et de mise en quarantaine des données
S'adaptera aux changements, les problèmes d'obsolescence sont évités

Résumé du cours vidéo

De manière générale, les points suivants prévalent dans la décision d'entraînement statique ou dynamique:

Les modèles statiques sont plus faciles à créer et à tester.
Les modèles dynamiques s'adaptent à l'évolution des données. Le monde est en constante évolution. Il est peu probable que les prédictions de ventes établies à partir des données de l'année dernière permettent de prédire avec succès les résultats de l'année prochaine.

Si votre ensemble de données ne change pas vraiment au fil du temps, choisissez l'entraînement statique, car il est moins cher à créer et à gérer que l'entraînement dynamique. Cependant, de nombreuses sources d'informations changent réellement au fil du temps, même celles dont les caractéristiques sont aussi constantes que le niveau de la mer, par exemple. La morale: même avec un entraînement statique, vous devez toujours surveiller vos données d'entrée pour les modifier.

Prenons l'exemple d'un modèle entraîné pour prédire la probabilité que les utilisateurs achèteront des fleurs. En raison de la pression du temps, le modèle n'est entraîné qu'une seule fois à l'aide d'un ensemble de données sur le comportement d'achat de fleurs durant les mois de juillet et août. Le modèle est ensuite expédié pour diffuser des prédictions en production, mais il n'est jamais mis à jour. Le modèle fonctionne bien pendant plusieurs mois, mais fera ensuite de terribles prédictions autour de la Saint-Valentin, car le comportement des utilisateurs pendant cette période change considérablement.

Systèmes de ML de production (3 min)

Testez vos connaissances