Вы, возможно, помните из упражнений с перекрестными признаками в модуле Категориальные данные , что следующая задача классификации является нелинейной:

«Нелинейный» означает, что вы не можете точно предсказать этикетку с помощью модели формы. . Другими словами, «поверхность принятия решений» — это не линия.
Однако, если мы выполним перекрестное преобразование наших объектов и , мы сможем представить нелинейную связь между двумя объектами, используя линейную модель : , где — это функция, пересекающаяся между и :

Теперь рассмотрим следующий набор данных:

Вы также можете вспомнить из упражнений по скрещиванию признаков , что определение правильных скрещиваний признаков для соответствия линейной модели этим данным потребовало немного больше усилий и экспериментов.
Но что, если бы вам не пришлось проводить все эти эксперименты самостоятельно? Нейронные сети — это семейство модельных архитектур, предназначенных для поиска нелинейных закономерностей в данных. Во время обучения нейронной сети модель автоматически изучает оптимальные пересечения функций для работы с входными данными, чтобы минимизировать потери.
В следующих разделах мы подробнее рассмотрим, как работают нейронные сети.