Jak być może pamiętasz, Funkcje ćwiczeń przekrojowych w module Dane kategorialne, że następujący problem klasyfikacji jest nieliniowy:
„Nielinearne” oznacza, że nie można dokładnie przewidzieć etykiety z ma postać \(b + w_1x_1 + w_2x_2\). Innymi słowy, "obszar decyzyjny" nie jest linią.
Jeśli jednak przeprowadzimy przekrój cech $x_1$ i $x_2$, możemy następnie zdefiniuj zależność nieliniową między dwoma obiektami za pomocą model liniowy: $b + w_1x_1 + w_2x_2 + w_3x_3$, gdzie $x_3$ to przecięcie funkcji $x_1$ i $x_2$:
Teraz przyjrzyjmy się temu zbiorowi danych:
Być może warto też zapamiętać z ćwiczeń łączących cechy. aby określenie właściwych cech przecinały się, aby dopasować model liniowy do tych danych wymagało to więcej wysiłku i eksperymentów.
Ale co by było, gdyby nie trzeba było samodzielnie przeprowadzać eksperymentów? Sieci neuronowe to rodzina architektur modeli zaprojektowanych pod kątem znajdowania nieliniowe w danych. Podczas trenowania sieci neuronowej model automatycznie uczy się optymalne krzyżówki cech, które będą działać na danych wejściowych, aby zminimalizować straty.
W kolejnych sekcjach przyjrzymy się bliżej, jak działają sieci neuronowe.