Systemy produkcyjne ML: sprawdź swoją wiedzę

Używasz systemów uczących się do utworzenia modelu klasyfikacji, który przewiduje pojawienie się jednorożców. W Twoim zbiorze danych znajduje się 10 000 występów jednorożców i 10 000 jednorożców, które nie występują. Zbiór danych obejmuje lokalizację, porę dnia, wysokość, temperaturę, wilgotność, zagęszczenie drzew, obecność tęczy i kilka innych parametrów.

Po uruchomieniu prognozy wyglądu jednorożca musisz zadbać o aktualność modelu, ponownie trenując go na nowych danych. Zbierasz zbyt dużo nowych danych, na których możesz je trenować, dlatego postanawiasz ograniczyć te dane przez próbkowanie ich przez pewien okres. Musisz też wziąć pod uwagę dzienne i roczne schematy pojawiania się jednorożca. Jaki przedział czasu wybierasz?

Pewnego dnia, ponieważ większe okno spowodowałoby zgromadzenie dużej ilości danych, a trenowanie modelu trwałoby za długo.

Tydzień, aby zbiór danych nie był zbyt duży, ale i tak można było wyrównać wzorce.

1 rok, aby mieć pewność, że model nie jest zafałszowany przez wzorce roczne.

Uruchamiasz prognozowany wygląd jednorożca. To działa, jak należy. Wyjeżdżasz na urlop i wracasz po 3 tygodniach, a potem stwierdzasz, że jakość modelu znacznie się obniżyła. Załóżmy, że zachowanie jednorożców nie zmieni się znacząco w ciągu 3 tygodni. Jakie jest najbardziej prawdopodobne wyjaśnienie spadku jakości?

Zniekształcenie między trenowaniem a zastosowaniem: format danych udostępniania stopniowo zmieniał się w pewnym momencie po rozpoczęciu udostępniania modelu.

Podczas trenowania została użyta dokładność.

Model jest nieaktualny.

Żadna z tych odpowiedzi –

Sprawdzasz prognozy modelu dla Antarktydy i okazuje się, że od momentu jego wprowadzenia do produkcji model generował słabe prognozy. Co może być przyczyną problemu?

Masz za mało przykładów treningowych do wykorzystania na Antarktydzie.

Zamiast trenowania statycznego zastosowano trenowanie dynamiczne.

Twój model stał się nieaktualny.

Wszystkie powyższe odpowiedzi

Twój prognozy wyglądu jednorożca działa od roku. Rozwiązaliśmy wiele problemów, a jakość jest teraz wysoka. Dostrzegasz jednak niewielki, ale stale występujący problem. Jakość Twojego modelu nieco spadła w obszarach miejskich. Co może być tego przyczyną?

Wysoka jakość prognoz sprawia, że użytkownicy mogą łatwo znaleźć jednorożce, co wpływa na ich zachowanie wyglądu.

Obszary miejskie są trudne do modelowania.

Sytuacje, w których występuje jednorożec, są zgłaszane wielokrotnie na gęsto zaludnionych obszarach, co zniekształca dane treningowe.

Podczas rozwiązywania wszystkich problemów znacznie poprawiła się jakość prognoz modelu jednorożca, w rezultacie dziesięciokrotnie zwiększyło się jego wykorzystanie. Użytkownicy narzekają jednak, że model działa bardzo wolno. Zwrócenie prognoz zajmuje zwykle ponad 30 sekund. Która z poniższych zmian może pomóc rozwiązać ten problem?

Zmień model z trenowania dynamicznego na trenowanie statyczne.

Przełącz model z wnioskowania dynamicznego na statyczny.

Zweryfikuj jakość modelu przed jego wyświetleniem.

Żadne z powyższych rozwiązań nie pomoże.