Réseaux de neurones

Vous vous souvenez peut-être Exercices de croisement de caractéristiques dans le module Données catégorielles, que le problème de classification suivant est non linéaire:

Figure 1. Plan de coordonnées cartésien, divisé en quatre
      quadrants, chacun rempli de points aléatoires ressemblant à une
      carré. Les points dans les quadrants 
en haut à droite et en bas à gauche sont bleus,
      et les points des quadrants 
en haut à gauche et en bas à droite sont orange.
Image 1. Problème de classification non linéaire. Une fonction linéaire ne peut pas séparez clairement tous les points bleus des points orange.

Non linéaire signifie qu'il est impossible de prédire avec précision une étiquette au format \(b + w_1x_1 + w_2x_2\). En d'autres termes, "surface de décision" n'est pas une ligne.

Toutefois, si nous effectuons un croisement de caractéristiques $x_1$ et $x_2$, nous pouvons puis représenter la relation non linéaire entre les deux caractéristiques à l'aide d'une modèle linéaire: $b + w_1x_1 + w_2x_2 + w_3x_3$ où $x_3$ est le croisement de caractéristiques entre $x_1$ et $x_2$:

Figure 2. Le même plan cartésien aux coordonnées bleu et orange
      comme illustré dans la figure 1.  Cette fois, une courbe hyperbolique blanche est représentée
      au-dessus de la grille, qui sépare les points bleus en haut à droite
      et les quadrants en bas à gauche (désormais ombrés avec un fond bleu)
      les points orange situés dans les quadrants supérieur gauche et inférieur droit (maintenant
      sur un fond orange).
Figure 2 : En ajoutant le croisement de caractéristiques x1x2, le modèle linéaire peut apprendre une forme hyperbolique qui sépare les points bleus des points orange.

Prenons maintenant l'ensemble de données suivant:

Figure 3. Plan de coordonnées cartésien, divisé en quatre quadrants.
      Un groupe circulaire de points bleus est centré à l'origine du
      graphique et est entouré d'un cercle de points orange.
Figure 3 : Problème de classification non linéaire plus complexe.

Nous avons également vu les exercices de croisement de caractéristiques que déterminer les croisements de caractéristiques appropriés pour appliquer un modèle linéaire à ces données a demandé un peu plus d'efforts et d'expérimentation.

Mais que se passerait-il si vous ne deviez pas réaliser tous ces tests vous-même ? Les réseaux de neurones constituent une famille d'architectures de modèles conçues pour trouver non linéaire des modèles dans les données. Lors de l'entraînement d'un réseau de neurones, model automatiquement apprend les croisements de caractéristiques optimaux à effectuer sur les données d'entrée pour minimiser de perte de données.

Dans les sections suivantes, nous allons examiner de plus près le fonctionnement des réseaux de neurones.