Vous vous souvenez peut-être Exercices de croisement de caractéristiques dans le module Données catégorielles, que le problème de classification suivant est non linéaire:
Non linéaire signifie qu'il est impossible de prédire avec précision une étiquette au format \(b + w_1x_1 + w_2x_2\). En d'autres termes, "surface de décision" n'est pas une ligne.
Toutefois, si nous effectuons un croisement de caractéristiques $x_1$ et $x_2$, nous pouvons puis représenter la relation non linéaire entre les deux caractéristiques à l'aide d'une modèle linéaire: $b + w_1x_1 + w_2x_2 + w_3x_3$ où $x_3$ est le croisement de caractéristiques entre $x_1$ et $x_2$:
Prenons maintenant l'ensemble de données suivant:
Nous avons également vu les exercices de croisement de caractéristiques que déterminer les croisements de caractéristiques appropriés pour appliquer un modèle linéaire à ces données a demandé un peu plus d'efforts et d'expérimentation.
Mais que se passerait-il si vous ne deviez pas réaliser tous ces tests vous-même ? Les réseaux de neurones constituent une famille d'architectures de modèles conçues pour trouver non linéaire des modèles dans les données. Lors de l'entraînement d'un réseau de neurones, model automatiquement apprend les croisements de caractéristiques optimaux à effectuer sur les données d'entrée pour minimiser de perte de données.
Dans les sections suivantes, nous allons examiner de plus près le fonctionnement des réseaux de neurones.