Ricordiamo che Esercizi incrociati sulle caratteristiche nel modulo Dati categoriali, che il seguente problema di classificazione non è lineare:

"Non lineare" significa che non puoi prevedere con precisione un'etichetta con un modello del formato \(b + w_1x_1 + w_2x_2\). In altre parole, la "superficie di decisione" non è una linea.
Tuttavia, se eseguiamo un'intersezione di caratteristiche sulle nostre caratteristiche $x_1$ e $x_2$, possiamo rappresentare la relazione non lineare tra le due caratteristiche utilizzando un modello lineare: $b + w_1x_1 + w_2x_2 + w_3x_3$ dove $x_3$ è l'intersezione di caratteristiche tra $x_1$ e $x_2$:

Consideriamo ora il seguente set di dati:

Potresti anche ricordare dagli esercizi sulle intersezioni delle caratteristiche che determinare le intersezioni delle caratteristiche corrette per adattare un modello lineare a questi dati ha richiesto un po' più di impegno e sperimentazione.
E se non dovessi eseguire personalmente tutte queste sperimentazioni? Le reti neurali sono una famiglia di architetture di modelli progettate per trovare pattern non lineari nei dati. Durante l'addestramento di una rete neurale, model automaticamente Apprende gli incroci di caratteristiche ottimali da eseguire sui dati di input per ridurre al minimo o una perdita di dati.
Nelle sezioni seguenti, esamineremo più da vicino come funzionano le reti neurali.