Modell implementieren

Beginnen Sie mit der Implementierung eines Modells einfach. Der Großteil der Arbeit bei ML liegt auf der Datenseite. Daher ist es schwieriger, eine vollständige Pipeline für ein komplexes Modell auszuführen, als auf dem Modell selbst zu iterieren. Nachdem Sie Ihre Datenpipeline eingerichtet und ein einfaches Modell mit einigen Features implementiert haben, können Sie iterieren, um ein besseres Modell zu erstellen.

Einfache Modelle bieten eine gute Basis, auch wenn Sie diese am Ende nicht einführen. Tatsächlich ist die Verwendung eines einfachen Modells wahrscheinlich besser, als Sie denken. Wenn Sie mit „einfach“ beginnen, können Sie feststellen, ob ein komplexes Modell überhaupt gerechtfertigt ist oder nicht.

Eigenes Modell trainieren oder ein vortrainiertes Modell verwenden

Viele vortrainierte Modelle gibt es für eine Vielzahl von Anwendungsfällen und bieten viele Vorteile. Allerdings funktionieren vortrainierte Modelle nur dann wirklich, wenn das Label und die Features genau mit Ihrem Dataset übereinstimmen. Wenn ein vortrainiertes Modell beispielsweise 25 Features verwendet und Ihr Dataset nur 24 Features enthält, trifft das vortrainierte Modell höchstwahrscheinlich fehlerhafte Vorhersagen.

ML-Experten verwenden üblicherweise übereinstimmende Unterabschnitte von Eingaben aus einem vortrainierten Modell für die Feinabstimmung oder den Lerntransfer. Wenn für Ihren speziellen Anwendungsfall kein vortrainiertes Modell vorhanden ist, sollten Sie beim Trainieren eines eigenen Modells Unterabschnitte aus einem vortrainierten Modell verwenden.

Informationen zu vortrainierten Modellen finden Sie unter

Monitoring

Berücksichtigen Sie beim Erstellen von Problemen die Infrastruktur für Monitoring und Benachrichtigungen, die Ihre ML-Lösung benötigt.

Modellbereitstellung

In einigen Fällen kann ein neu trainiertes Modell schlechter als das derzeit in der Produktion befindliche Modell sein. Ist dies der Fall, sollten Sie verhindern, dass sie in die Produktion freigegeben wird, und eine Benachrichtigung erhalten, dass Ihre automatisierte Bereitstellung fehlgeschlagen ist.

Abweichungen zwischen Training und Bereitstellung

Wenn eines der für die Inferenz verwendeten eingehenden Features Werte hat, die außerhalb des Verteilungsbereichs der für das Training verwendeten Daten liegen, sollten Sie benachrichtigt werden, da das Modell wahrscheinlich schlechte Vorhersagen macht. Wenn Ihr Modell beispielsweise darauf trainiert wurde, Temperaturen in Äquatorialstädten auf Meereshöhe vorherzusagen, sollten Sie von Ihrem Bereitstellungssystem über eingehende Daten mit Breiten- und Längengraden und/oder Höhen außerhalb des Bereichs benachrichtigt werden, in dem das Modell trainiert wurde. Umgekehrt sollte Sie das Bereitstellungssystem benachrichtigen, wenn das Modell Vorhersagen trifft, die außerhalb des Verteilungsbereichs liegen, der während des Trainings beobachtet wurde.

Inferenzserver

Wenn Sie Inferenzen über ein RPC-System bereitstellen, sollten Sie den RPC-Server selbst überwachen und eine Warnung erhalten, wenn er keine Inferenzen mehr bereitstellt.