Wenn Sie ein neues Machine-Learning-Projekt starten, fragen Sie sich vielleicht, ob das manuelle Training die einzige Option ist, um ein Machine-Learning-Modell zu erstellen. Beim manuellen Training schreiben Sie Code mit einem ML-Framework, um ein Modell zu erstellen. Dabei wählen Sie aus, welche Algorithmen untersucht werden sollen, und passen die Hyperparameter iterativ an, um das richtige Modell zu finden.
Natürlich müssen Sie nicht nur auf das Modelltraining achten. In der Praxis erfordert das Erstellen eines Modells für maschinelles Lernen vom Prototyp bis zur Produktion repetitive Aufgaben und spezielle Fähigkeiten. Ein einfaches exploratives ML sieht der Workflow in etwa so aus:
Wiederkehrende Aufgaben: Der ML-Workflow kann sich aus wiederkehrenden Aufgaben und Tests zusammensetzen. Zum Beispiel müssen Sie bei der Modellentwicklung verschiedene Kombinationen von Algorithmen und Hyperparametern zu untersuchen, am besten geeignet ist. Beim manuellen Training schreiben Sie speziellen Code Trainieren Sie das Modell und passen Sie den Code dann an, um Tests mit verschiedenen ML-Modellen auszuführen. um das beste Modell zu finden. Für kleine oder experimentelle Projekte ist dieser manuelle Prozess zwar kein Problem, aber für größere Projekte wiederholte Aufgaben zeitaufwändig sein.
Spezialkenntnisse: Die manuelle Entwicklung eines ML-Modells erfordert spezielle Kenntnisse. In der Praxis kann nicht jedes Team, das die Entwicklung eines ML-Modells plant, die diese Fähigkeiten besitzen. Hat ein Team keinen speziellen Data Scientist, ist diese Arbeit manuell vielleicht nicht einmal realisierbar.
Glücklicherweise können bestimmte Schritte bei der Modellentwicklung automatisiert werden, um den Aufwand für sich wiederholende Aufgaben und den Bedarf an Fachkenntnissen zu reduzieren. Die Automatisierung dieser Aufgaben ist das Thema dieses Moduls zum automatisierten maschinellen Lernen (AutoML).
Was ist AutoML?
AutoML ist ein Verfahren, mit dem bestimmte Aufgaben in einem Workflow für maschinelles Lernen automatisiert werden. Stellen Sie sich AutoML als eine Reihe von Tools und Technologien vor, die das Erstellen Modelle für maschinelles Lernen schneller und zugänglicher für eine größere Gruppe von Nutzern. Automatisierung kann zwar während des gesamten ML-Workflows hilfreich sein, die Aufgaben, die oft mit AutoML in Verbindung gebracht werden, sind jedoch Teil des Modellentwicklungszyklus, der in Abbildung 1 dargestellt ist. Zu diesen wiederholten Aufgaben gehören:
- Data Engineering
- Feature Engineering
- Auswahl von Merkmalen.
- Schulungen
- Einen geeigneten ML-Algorithmus identifizieren
- Die besten Hyperparameter auswählen
- Analyse
- Bewerten von Messwerten, die während des Trainings basierend auf Tests und Validierungs-Datasets.
Mit AutoML können Sie sich auf Ihre ML-Probleme und Daten konzentrieren, anstatt auf Features. Auswahl, Feinabstimmung von Hyperparametern und Auswahl des richtigen Algorithmus.