Nadmierne przekroczenie budżetu?
Zanim obejrzysz film lub przeczytasz dokumentację, wykonaj to ćwiczenie. Chodzi o nadużywanie różnych funkcji.
Zadanie 1. Uruchom model w niezmienionej postaci, uwzględniając wszystkie funkcje różnych usług. Czy są jakieś niespodzianki w sposobie dopasowania danych przez model?
Na czym polega problem?
Zadanie 2. Spróbuj usunąć różne funkcje różnych usług, aby poprawić wydajność (chociaż nieznacznie). Dlaczego usunięcie funkcji
poprawiłoby wydajność?
(Odpowiedzi pojawią się tuż pod ćwiczeniem).
Aby odpowiedzieć na zadanie 1, kliknij ikonę plusa.
Co ciekawe, granica decyzji modelu wygląda dziwnie. W szczególności w lewym górnym rogu znajduje się region, który wskazuje na kolor niebieski, chociaż w danych nie jest to widoczne.
Zwróć uwagę na względną grubość pięciu linii działających od INPUT do OUTPUT.
Linie te wskazują względną wagę 5 obiektów.
Linie wychodzące z obiektów X1 i X2 są znacznie grubsze niż te pochodzące z krzyżyków. Tak więc krzyże cech mają o wiele mniejszy udział w modelu niż normalne (nieprzekreślone) cechy.
Kliknij ikonę plusa, aby odpowiedzieć na zadanie 2.
Usunięcie wszystkich krzyżyków cech daje bardziej rozsądny model (nie ma już zakrzywionej granicy sugerującej nadmierne dopasowanie) i sprawia, że strata w ramach testu zbiega się.
Po 1000 iteracji wartość strat w ramach testów powinna być nieco niższa niż w przypadku, gdy krzyżyki były w toku (choć wyniki mogą się nieco różnić w zależności od zbioru danych).
Dane w tym ćwiczeniu to dane liniowe i szum.
Jeśli używamy zbyt złożonego modelu (np. modelu ze zbyt dużą liczbą krzyżyków), dajemy mu możliwość dopasowania się do szumu w danych treningowych, często kosztem obniżenia jego skuteczności na danych testowych.