ML-Produktionssysteme: Statisches und dynamisches Training im Vergleich

Im Allgemeinen gibt es zwei Möglichkeiten, ein Modell zu trainieren:

  • Beim statischen Training (auch Offlinetraining genannt) wird ein Modell nur einmal trainiert. Sie stellen dieses trainierte Modell dann für eine Weile bereit.
  • Beim dynamischen Training (auch Onlinetraining genannt) wird ein Modell kontinuierlich oder zumindest häufig trainiert. Normalerweise wird das am neuesten trainierte Modell bereitgestellt.
Abbildung 2. Aus dem Rohteig werden drei identische Brotlaibe hergestellt.
Abbildung 2. Statisches Training Einmal trainieren, dasselbe erstellte Modell mehrmals ausliefern (Bilder von Pexels und von fancycrave1)

 

Abbildung 3: Aus dem Rohteig entstehen jedes Mal leicht unterschiedliche Brotlaibe.
Abbildung 3. Dynamisches Training Trainieren Sie das Modell regelmäßig neu und verwenden Sie das jeweils neueste Modell. (Bilder von Pexels und Couleur)

 

Tabelle 1. Hauptvorteile und -nachteile

Statisches Training Dynamisches Training
Vorteile Einfacher. Sie müssen das Modell nur einmal entwickeln und testen. Mehr Anpassungsmöglichkeiten Ihr Modell bleibt auf dem neuesten Stand, wenn sich die Beziehung zwischen Merkmalen und Labels ändert.
Nachteile Manchmal älter. Wenn sich die Beziehung zwischen Features und Labels im Laufe der Zeit ändert, verschlechtern sich die Vorhersagen Ihres Modells. Mehr Arbeit. Sie müssen ständig neue Produkte entwickeln, testen und veröffentlichen.

Wenn sich Ihr Dataset im Laufe der Zeit nicht ändert, wählen Sie das statische Training aus, da es kostengünstiger ist, es zu erstellen und zu pflegen als das dynamische Training. Datasets ändern sich jedoch im Laufe der Zeit, auch solche mit Merkmalen, die Sie für konstant halten, z. B. der Meeresspiegel. Fazit: Auch bei statischem Training müssen Sie Ihre Eingabedaten auf Änderungen überwachen.

Angenommen, Sie haben ein Modell trainiert, das die Wahrscheinlichkeit vorhersagen soll, dass Nutzer Blumen kaufen. Aufgrund von Zeitdruck wird das Modell nur einmal mit einem Dataset zum Kaufverhalten von Blumen im Juli und August trainiert. Das Modell funktioniert mehrere Monate lang gut, macht aber um den Valentinstag herum schlechte Vorhersagen, weil sich das Nutzerverhalten während dieses Blumentags dramatisch ändert.

Weitere Informationen zu statischem und dynamischem Training finden Sie im Kurs ML-Projekte verwalten.

Übungen: Wissen testen

Welche zwei der folgenden Aussagen treffen auf statische (offline) Trainings zu?
Bei Offline-Trainings müssen Trainingsjobs weniger überwacht werden als bei Online-Trainings.
Sie können das Modell prüfen, bevor Sie es in der Produktion anwenden.
Bei der Inferenz müssen die Eingabedaten nur sehr wenig überwacht werden.
Das Modell bleibt auf dem neuesten Stand, wenn neue Daten eintreffen.
Welche der folgenden Aussagen trifft auf dynamische (Online-)Schulungen zu?
Bei der Inferenz müssen die Eingabedaten nur sehr wenig überwacht werden.
Die Überwachung von Trainingsjobs ist nur sehr geringfügig erforderlich.
Das Modell bleibt auf dem neuesten Stand, wenn neue Daten eintreffen.