Jak być może pamiętasz, Funkcje ćwiczeń przekrojowych w module Dane kategorialne, że następujący problem klasyfikacji jest nieliniowy:

„Nielinearne” oznacza, że nie można dokładnie przewidzieć etykiety z ma postać . Innymi słowy, "obszar decyzyjny" nie jest linią.
Jeśli jednak przeprowadzimy przekrój cech i , możemy następnie zdefiniuj zależność nieliniową między dwoma obiektami za pomocą model liniowy: , gdzie to przecięcie funkcji i :

Teraz przyjrzyjmy się temu zbiorowi danych:

Być może warto też zapamiętać z ćwiczeń łączących cechy. aby określenie właściwych cech przecinały się, aby dopasować model liniowy do tych danych wymagało to więcej wysiłku i eksperymentów.
Ale co by było, gdyby nie trzeba było samodzielnie przeprowadzać eksperymentów? Sieci neuronowe to rodzina architektur modeli zaprojektowanych pod kątem znajdowania nieliniowe w danych. Podczas trenowania sieci neuronowej model automatycznie uczy się optymalne krzyżówki cech, które będą działać na danych wejściowych, aby zminimalizować straty.
W kolejnych sekcjach przyjrzymy się bliżej, jak działają sieci neuronowe.