Ви можете пригадати з вправ на поєднання ознак, наведених у модулі "Категорійні дані", що ця задача класифікації нелінійна:
"Нелінійна" означає, що не можна точно спрогнозувати мітку за допомогою моделі у вигляді \(b + w_1x_1 + w_2x_2\). Іншими словами, "поверхня рішень" – це не лінія.
Однак, якщо поєднати ознаки $x_1$ і $x_2$, між ними буде встановлено нелінійний зв’язок за допомогою лінійної моделі: $b + w_1x_1 + w_2x_2 + w_3x_3$, де $x_3$ – поєднання ознак $x_1$ і $x_2$:
Тепер розгляньмо такий набір даних:
Ви можете також пам’ятати з вправ на поєднання ознак, що потрібно докласти більше зусиль і поекспериментувати, щоб визначити правильні поєднання для пристосування лінійної моделі до таких даних.
А що як вам не доведеться проводити всі ці експерименти самостійно? Нейронні мережі – це сімейство архітектур моделей, призначених для пошуку нелінійних закономірностей у даних. Під час тренування нейронної мережі модель автоматично вивчає, які поєднання ознак будуть оптимальними для вхідних даних і мінімізують втрати.
У наступних розділах ми докладно розглянемо, як працюють нейронні мережі.