Systemy produkcyjne ML: sprawdź swoją wiedzę

  1. Używasz systemów uczących się do utworzenia modelu klasyfikacji, który przewiduje pojawienie się jednorożców. W Twoim zbiorze danych znajduje się 10 000 występów jednorożców i 10 000 jednorożców, które nie występują. Zbiór danych obejmuje lokalizację, porę dnia, wysokość, temperaturę, wilgotność, zagęszczenie drzew, obecność tęczy i kilka innych parametrów.

    Po uruchomieniu prognozy wyglądu jednorożca musisz zadbać o aktualność modelu, ponownie trenując go na nowych danych. Zbierasz zbyt dużo nowych danych, na których możesz je trenować, dlatego postanawiasz ograniczyć te dane przez próbkowanie ich przez pewien okres. Musisz też wziąć pod uwagę dzienne i roczne schematy pojawiania się jednorożca. Jaki przedział czasu wybierasz?

  2. Uruchamiasz prognozowany wygląd jednorożca. To działa, jak należy. Wyjeżdżasz na urlop i wracasz po 3 tygodniach, a potem stwierdzasz, że jakość modelu znacznie się obniżyła. Załóżmy, że zachowanie jednorożców nie zmieni się znacząco w ciągu 3 tygodni. Jakie jest najbardziej prawdopodobne wyjaśnienie spadku jakości?

  3. Sprawdzasz prognozy modelu dla Antarktydy i okazuje się, że od momentu jego wprowadzenia do produkcji model generował słabe prognozy. Co może być przyczyną problemu?

  4. Twój prognozy wyglądu jednorożca działa od roku. Rozwiązaliśmy wiele problemów, a jakość jest teraz wysoka. Dostrzegasz jednak niewielki, ale stale występujący problem. Jakość Twojego modelu nieco spadła w obszarach miejskich. Co może być tego przyczyną?

  5. Podczas rozwiązywania wszystkich problemów znacznie poprawiła się jakość prognoz modelu jednorożca, w rezultacie dziesięciokrotnie zwiększyło się jego wykorzystanie. Użytkownicy narzekają jednak, że model działa bardzo wolno. Zwrócenie prognoz zajmuje zwykle ponad 30 sekund. Która z poniższych zmian może pomóc rozwiązać ten problem?