Modell implementieren

Beginnen Sie mit der Implementierung eines Modells einfach. Der Großteil der Arbeit beim ML geht auf die Datenseite. Daher ist es schwieriger, eine vollständige Pipeline für ein komplexes Modell auszuführen, als das Modell selbst zu iterieren. Nachdem Sie Ihre Datenpipeline eingerichtet und ein einfaches Modell mit einigen Features implementiert haben, können Sie über das Erstellen eines besseren Modells iterieren.

Einfache Modelle bieten eine gute Basis, auch wenn sie am Ende nicht eingeführt werden. Tatsächlich ist ein einfaches Modell wahrscheinlich besser, als Sie denken. Wenn Sie mit der einfachen Methode beginnen, können Sie feststellen, ob ein komplexes Modell überhaupt gerechtfertigt ist.

Eigenes Modell trainieren oder bereits trainiertes Modell verwenden

Trainierte Modelle gibt es für eine Vielzahl von Anwendungsfällen und bieten viele Vorteile. Trainierte Modelle funktionieren jedoch nur dann wirklich, wenn das Label und die Features genau mit Ihrem Dataset übereinstimmen. Wenn ein trainiertes Modell beispielsweise 25 Features verwendet und Ihr Dataset nur 24 Features enthält, kann das trainierte Modell höchstwahrscheinlich fehlerhafte Vorhersagen machen.

Häufig verwenden ML-Fachleute übereinstimmende Unterabschnitte der Eingaben aus einem trainierten Modell zur Feinabstimmung oder Lerntransfer. Wenn für Ihren speziellen Anwendungsfall kein trainiertes Modell vorhanden ist, sollten Sie beim Trainieren Ihres eigenen Modells Unterabschnitte aus einem trainierten Modell verwenden.

Informationen zu trainierten Modellen finden Sie unter

Monitoring

Berücksichtigen Sie beim Problem-Framing die Monitoring- und Benachrichtigungsinfrastruktur, die Ihre ML-Lösung benötigt.

Modellbereitstellung

In einigen Fällen ist ein neu trainiertes Modell möglicherweise schlechter als das Modell, das sich derzeit in der Produktion befindet. Wenn dies der Fall ist, sollten Sie verhindern, dass es in die Produktion freigegeben wird, und eine Benachrichtigung erhalten, dass Ihre automatisierte Bereitstellung fehlgeschlagen ist.

Abweichungen zwischen Training und Bereitstellung

Wenn eines der für die Inferenz verwendeten eingehenden Features Werte hat, die außerhalb des Verteilungsbereichs der für das Training verwendeten Daten liegen, sollten Sie benachrichtigt werden, da das Modell wahrscheinlich schlechte Vorhersagen machen wird. Wenn Ihr Modell beispielsweise darauf trainiert wurde, Temperaturen in Äquatorialstädten auf Meeresspiegel vorherzusagen, sollte das Bereitstellungssystem Sie über eingehende Daten mit Breiten- und Längengraden und/oder Höhen außerhalb des Bereichs benachrichtigen, in dem das Modell trainiert wurde. Umgekehrt sollte das Bereitstellungssystem Sie benachrichtigen, wenn das Modell Vorhersagen außerhalb des Verteilungsbereichs trifft, der während des Trainings beobachtet wurde.

Inferenzserver

Wenn Sie Inferenzen über ein RPC-System bereitstellen, sollten Sie den RPC-Server selbst überwachen und eine Benachrichtigung erhalten, wenn er keine Inferenzen mehr bereitstellt.