Übersicht über ML-Pipelines

Glückwunsch! Ihr Modell ist bereit für die Bereitstellung in einer ML-Produktionspipeline. In diesem Abschnitt des Kurses werden Testrichtlinien für ML-Pipelines vorgestellt. In diesem Abschnitt werden diese Richtlinien jedoch nicht gezeigt, da eine solche Demo in einer Sandbox-Umgebung nicht möglich ist.

Sie erhalten Informationen zu folgenden Themen:

  • Geeignete Tests für Markteinführung und Produktion schreiben
  • Erkennung von Fehlermodi in Ihrer ML-Pipeline mithilfe von Tests
  • Modellqualität in der Produktionsumgebung bewerten

Was ist eine ML-Pipeline?

Eine ML-Pipeline besteht aus mehreren Komponenten, wie das Diagramm zeigt. Wir werden diese Komponenten später noch kennenlernen. Beachten Sie vorerst, dass das „Modell“ (der Blackbox) ein kleiner Teil der Pipelineinfrastruktur ist, der für ML in der Produktion erforderlich ist.

Ein Schema einer typischen Pipeline für maschinelles Lernen. Das Schema zeigt mehrere Kästchen, eine für jede Komponente der Pipeline. Das Kästchen „Modell“ befindet sich in der Mitte des Schemas. Die anderen Kästchen sind um die Modellbox herum angeordnet. Diese Kästchen sind beschriftet: Datenerhebung, Datenverifizierung, Verwaltung von Maschinenressourcen, Infrastruktur, Feature-Extraktion, Analysetools, Prozessverwaltungstools, Konfiguration und Monitoring.
Abbildung 1: Schematische Darstellung einer typischen Pipeline für maschinelles Lernen

Rolle der Tests in ML-Pipelines

In der Softwareentwicklung folgt der ideale Workflow der testbasierten Entwicklung (TDD). In ML ist es jedoch nicht ganz einfach, mit Tests zu beginnen. Die Tests hängen von Ihren Daten, Ihrem Modell und dem Problem ab. Beispielsweise können Sie vor dem Training Ihres Modells keinen Test schreiben, um den Verlust zu validieren. Sie ermitteln stattdessen den erreichbaren Verlust bei der Modellentwicklung und testen dann neue Modellversionen mit dem erreichbaren Verlust.

Sie benötigen Tests für:

  • Eingabedaten validieren.
  • Feature Engineering wird geprüft.
  • Die Qualität neuer Modellversionen wird geprüft.
  • Bereitstellungsinfrastruktur prüfen.
  • Testen Sie die Integration zwischen den Pipelinekomponenten.