Implementacja modelu

Implementując model, zacznij od samego początku. Większość pracy w systemach uczących się wykonywana jest po stronie danych, dlatego uruchomienie pełnego potoku obejmującego złożony model jest trudniejsze niż iteracja w samym modelu. Po skonfigurowaniu potoku danych i zaimplementowaniu prostego modelu z kilkoma funkcjami możesz iterować, aby uzyskać lepszy model.

Proste modele stanowią dobrą podstawę, nawet jeśli w końcu ich nie wprowadzisz. W rzeczywistości użycie prostego modelu jest prawdopodobnie lepsze, niż Ci się wydaje. Rozpoczęcie prostego pomaga określić, czy złożony model jest w ogóle uzasadniony.

Trenowanie własnego modelu z użyciem modelu, który został już wytrenowany

Wytrenowane modele mają wiele zalet i są przeznaczone do różnych zastosowań. Wytrenowane modele działają jednak tylko wtedy, gdy etykieta i cechy dokładnie pasują do zbioru danych. Jeśli na przykład wytrenowany model wykorzystuje 25 cech, a zbiór danych zawiera tylko 24, wytrenowany model najprawdopodobniej wygeneruje nieprawidłowe prognozy.

Zwykle osoby stosujące systemy uczące się korzystają z dopasowywania podsekcji danych wejściowych z wytrenowanego modelu do dostrajania lub uczenia się transferu. Jeśli wytrenowany model nie istnieje w danym przypadku użycia, podczas trenowania własnego rozważ użycie podsekcji wytrenowanego modelu.

Informacje o wytrenowanych modelach:

Monitorowanie

Podczas kadrowania problemów weź pod uwagę infrastrukturę monitorowania i alertów, której potrzebuje Twoje rozwiązanie ML.

Wdrażanie modelu

W niektórych przypadkach nowo wytrenowany model może być gorszy niż ten obecnie w środowisku produkcyjnym. Jeśli tak, zapobiegniesz jego wprowadzeniu do środowiska produkcyjnego i otrzymasz alert o niepowodzeniu automatycznego wdrożenia.

Zniekształcenie między trenowaniem a zastosowaniem praktycznym

Jeśli któraś z funkcji przychodzących używanych do wnioskowania ma wartości wykraczające poza zakres rozkładu danych używanych podczas trenowania, warto otrzymywać alerty, ponieważ najprawdopodobniej model będzie generować słabe prognozy. Jeśli na przykład model został wytrenowany do prognozowania temperatury w miastach równikowych na poziomie morza, system obsługi powinien ostrzec Cię o napływających danych o szerokościach i długościach geograficznych lub wysokościach wykraczających poza zakres, na którym został wytrenowany model. I na odwrót: system obsługi powinien Cię ostrzec, jeśli model generuje prognozy spoza zakresu dystrybucji zaobserwowanego podczas trenowania.

Serwer wnioskowania

Jeśli używasz wnioskowania za pomocą systemu RPC, warto monitorować sam serwer RPC i otrzymywać alerty, gdy przestanie on podawać wnioskowania.