Vous vous souvenez peut-être Exercices de croisement de caractéristiques dans le module Données catégorielles, que le problème de classification suivant est non linéaire:

"Non linéaire" signifie qu'il n'est pas possible de prédire avec exactitude une étiquette avec un modèle de la forme \(b + w_1x_1 + w_2x_2\). En d'autres termes, "surface de décision" n'est pas une ligne.
Toutefois, si nous effectuons un croisement de caractéristiques $x_1$ et $x_2$, nous pouvons puis représenter la relation non linéaire entre les deux caractéristiques à l'aide d'une modèle linéaire: $b + w_1x_1 + w_2x_2 + w_3x_3$ où $x_3$ est le croisement de caractéristiques entre $x_1$ et $x_2$:

Prenons l'exemple de l'ensemble de données suivant :

Nous avons également vu les exercices de croisement de caractéristiques que déterminer les croisements de caractéristiques appropriés pour appliquer un modèle linéaire à ces données a demandé un peu plus d'efforts et d'expérimentation.
Mais que se passerait-il si vous ne deviez pas réaliser tous ces tests vous-même ? Les réseaux de neurones sont une famille d'architectures de modèles conçues pour trouver des modèles non linéaires dans les données. Lors de l'entraînement d'un réseau de neurones, le modèle apprend automatiquement les croisements de caractéristiques optimaux à effectuer sur les données d'entrée afin de minimiser les pertes.
Dans les sections suivantes, nous verrons de plus près comment fonctionnent les réseaux de neurones.