sieci neuronowe,

Jak być może pamiętasz z ćwiczeń dotyczących krzyżowania cechmodule „Dane kategorialne”, ten problem klasyfikacji jest nieliniowy:

Rysunek 1. Kartezyjski układ współrzędnych podzielony na cztery
      ćwiartki, z których każdy jest wypełniony losowymi kropkami,
      do kwadratu. Kropki w prawym górnym i lewym dolnym ćwiartce są niebieskie, a w lewym górnym i prawym dolnym ćwiartce – pomarańczowe.
Rysunek 1. Problem z klasyfikacją nieliniową. Funkcja liniowa nie może wyraźnie oddzielić niebieskich punktów od pomarańczowych.

„Nielinearne” oznacza, że nie można dokładnie przewidzieć etykiety z ma postać \(b + w_1x_1 + w_2x_2\). Innymi słowy, „powierzchnia decyzji” nie jest linią.

Jeśli jednak wykonamy krzyżowanie cech $x_1$ i $x_2$, możemy przedstawić nieliniową zależność między tymi cechami za pomocą modelu liniowego: $b + w_1x_1 + w_2x_2 + w_3x_3$, gdzie $x_3$ to cecha krzyżowania cech $x_1$ i $x_2$:

Rysunek 2.  Ta sama płaszczyzna kartezjańska z niebieskimi i pomarańczowymi kropkami jak na rysunku 1.  Tym razem jednak biała krzywa hiperboliczna
      są wyświetlane nad siatką, która rozdziela niebieskie punkty w prawym górnym rogu,
      i lewe dolne ćwiartki (teraz zacienione na niebieskim tle) od
      pomarańczowe kropki w lewym górnym i prawym dolnym rogu (teraz
      z pomarańczowym tłem).
Rysunek 2. Przez dodanie krzyżyka x1x2, model liniowy może się uczyć hiperboliczny kształt oddzielający niebieskie kropki od pomarańczowych.

Weź pod uwagę ten zbiór danych:

Rysunek 3.  Układ współrzędnych kartezjańskich podzielony na 4 kwadranty.
      Okrągły zbiór niebieskich punktów znajduje się w środku wykresu i jest otoczony pierścieniem pomarańczowych punktów.
Rysunek 3. Trudny problem z klasyfikacją nieliniową.

Być może warto też zapamiętać z ćwiczeń obejmujących różne cechy. aby określenie właściwych cech przecinały się, aby dopasować model liniowy do tych danych wymagało to więcej wysiłku i eksperymentów.

Co jednak, jeśli nie musisz przeprowadzać wszystkich eksperymentów samodzielnie? Sieci neuronowe to rodzina architektur modeli zaprojektowanych pod kątem znajdowania nonlinear w danych. Podczas trenowania sieci neuronowej model automatycznie uczy się optymalnych przecięć cech, które mają być wykonywane na danych wejściowych, aby zminimalizować straty.

W kolejnych sekcjach przyjrzymy się bliżej działaniu sieci neuronowych.