Implementacja modelu

Implementując model, zacznij od podstaw. Większość pracy w systemach uczących się wykonywana jest po stronie danych, dlatego uruchomienie pełnego potoku uruchomionego dla złożonego modelu jest trudniejsze niż powtórzenie go na modelu. Po skonfigurowaniu potoku danych i zaimplementowaniu prostego modelu używającego kilku funkcji możesz wielokrotnie tworzyć lepszy model.

Proste modele stanowią dobry punkt odniesienia, nawet jeśli ostatecznie nie zostaną wprowadzone na rynek. W rzeczywistości użycie prostego modelu jest prawdopodobnie lepsze, niż Ci się wydaje. Rozpoczęcie prostego tworzenia pomaga określić, czy złożony model jest w ogóle uzasadniony.

Trenowanie własnego modelu lub modelu wytrenowanego

Istnieje wiele wytrenowanych modeli do różnych zastosowań i mają wiele zalet. Wytrenowane modele działają jednak tylko wtedy, gdy etykieta i funkcje dokładnie pasują do zbioru danych. Jeśli na przykład wytrenowany model korzysta z 25 funkcji, a zbiór danych zawiera tylko 24 z nich, już wytrenowany model najprawdopodobniej wygeneruje błędne prognozy.

Zwykle osoby odpowiedzialne za korzystanie z systemów uczących się korzystają z dopasowywania podsekcji danych wejściowych z wytrenowanego modelu, aby doprecyzować lub przekazać uczenie się. Jeśli w Twoim przypadku użycia nie istnieje wstępnie wytrenowany model, podczas trenowania własnego rozważ użycie podsekcji z już wytrenowanego modelu.

Informacje o wytrenowanych modelach znajdziesz w sekcji

Monitorowanie

Podczas konstruowania problemów weź pod uwagę infrastrukturę monitorowania i tworzenia alertów, której potrzebuje Twoje rozwiązanie ML.

Wdrażanie modelu

W niektórych przypadkach nowo wytrenowany model może być gorszy niż ten obecnie wytrenowany. Jeśli tak, zapobiegniesz jego udostępnieniu w środowisku produkcyjnym i otrzymasz alert o niepowodzeniu automatycznego wdrożenia.

Zniekształcenie między trenowaniem a zastosowaniem praktycznym

Jeśli któraś z funkcji przychodzących używanych do wnioskowania ma wartości wykraczające poza zakres dystrybucji danych wykorzystywanych w trenowaniu, otrzymasz powiadomienie, ponieważ najprawdopodobniej model będzie generować słabe prognozy. Jeśli na przykład model został wytrenowany do prognozowania temperatury w miastach równikowych na poziomie morza, system obsługi powinien powiadamiać Cię o napływających danych dotyczących długości i szerokości geograficznej oraz wysokości wykraczających poza zakres, na którym trenowano model. I na odwrót, system obsługi powinien ostrzec Cię, jeśli model generuje prognozy wykraczające poza zakres dystrybucji zaobserwowany podczas trenowania.

Serwer wnioskowania

Jeśli wykorzystujesz wnioskowane dane za pomocą systemu RPC, musisz monitorować sam serwer RPC i otrzymywać alerty, gdy przestanie on podawać wnioskowane informacje.