Ви можете пригадати з вправ на поєднання ознак, наведених у модулі "Категорійні дані", що ця задача класифікації нелінійна:
![Рисунок 1. Декартова координатна площина, розділена на чотири квадранти, кожен із яких заповнено випадковими точками, що за формою нагадують квадрат. Точки у верхньому правому й нижньому лівому квадрантах – сині, а у верхньому лівому й нижньому правому – помаранчеві.](https://developers.google.cn/static/machine-learning/crash-course/neural-networks/images/nonlinear_simple.png?authuser=5&hl=uk)
"Нелінійна" означає, що не можна точно спрогнозувати мітку за допомогою моделі форми \(b + w_1x_1 + w_2x_2\). Іншими словами, "поверхня рішень" – це не лінія.
Однак якщо поєднати ознаки $x_1$ і $x_2$, між ними буде встановлено нелінійний зв’язок за допомогою лінійної моделі: $b + w_1x_1 + w_2x_2 + w_3x_3$, де $x_3$ – поєднання ознак $x_1$ і $x_2$:
![Рисунок 2. Та сама декартова координатна площина із синіми й помаранчевими точками, що й на рисунку 1. Однак цього разу поверх сітки нанесено білу гіперболічну криву, яка відокремлює сині точки, розміщені в правому верхньому й лівому нижньому квадрантах (тепер на синьому фоні) від помаранчевих точок у лівому верхньому й правому нижньому квадрантах (тепер на помаранчевому фоні).](https://developers.google.cn/static/machine-learning/crash-course/neural-networks/images/nonlinear_simple_feature_cross.png?authuser=5&hl=uk)
Тепер розгляньмо такий набір даних:
![Рисунок 3. Декартова координатна площина, розділена на чотири квадранти.
Кругове скупчення синіх точок відцентровано відносно початку координат і оточено кільцем помаранчевих точок.](https://developers.google.cn/static/machine-learning/crash-course/neural-networks/images/nonlinear_complex.png?authuser=5&hl=uk)
Ви можете також пам’ятати з вправ на поєднання ознак, що потрібно докласти більше зусиль і поекспериментувати, щоб визначити правильні поєднання для пристосування лінійної моделі до таких даних.
А що як вам не доведеться проводити всі ці експерименти самостійно? Нейронні мережі – це сімейство архітектур моделей, призначених для пошуку нелінійних закономірностей у даних. Під час тренування нейронної мережі модель автоматично вивчає, які поєднання ознак будуть оптимальними для вхідних даних і мінімізують втрати.
У наступних розділах ми докладно розглянемо, як працюють нейронні мережі.