Jak być może pamiętasz z ćwiczeń dotyczących krzyżowania cech w module „Dane kategorialne”, ten problem klasyfikacji jest nieliniowy:

„Nielinearne” oznacza, że nie można dokładnie przewidzieć etykiety z ma postać \(b + w_1x_1 + w_2x_2\). Innymi słowy, „powierzchnia decyzji” nie jest linią.
Jeśli jednak wykonamy krzyżowanie cech $x_1$ i $x_2$, możemy przedstawić nieliniową zależność między tymi cechami za pomocą modelu liniowego: $b + w_1x_1 + w_2x_2 + w_3x_3$, gdzie $x_3$ to cecha krzyżowania cech $x_1$ i $x_2$:

Weź pod uwagę ten zbiór danych:

Być może warto też zapamiętać z ćwiczeń obejmujących różne cechy. aby określenie właściwych cech przecinały się, aby dopasować model liniowy do tych danych wymagało to więcej wysiłku i eksperymentów.
Co jednak, jeśli nie musisz przeprowadzać wszystkich eksperymentów samodzielnie? Sieci neuronowe to rodzina architektur modeli zaprojektowanych pod kątem znajdowania nonlinear w danych. Podczas trenowania sieci neuronowej model automatycznie uczy się optymalnych przecięć cech, które mają być wykonywane na danych wejściowych, aby zminimalizować straty.
W kolejnych sekcjach przyjrzymy się bliżej działaniu sieci neuronowych.