Redes neurais

Talvez você se lembre da Exercícios de cruzamento de atributos no módulo de dados categóricos, que o seguinte problema de classificação não é linear:

Figura 1. Plano de coordenadas cartesiano, dividido em quatro
      quadrantes, cada um preenchido com pontos aleatórios em uma forma semelhante a uma
      quadrado. Os pontos no quadrante superior direito e inferior esquerdo são azuis,
      e os pontos nos quadrantes superior esquerdo e inferior direito são laranja.
Figura 1. Problema de classificação não linear. Uma função linear não pode separe claramente todos os pontos azuis dos pontos laranjas.

"Não linear" significa que não é possível prever um rótulo com precisão modelo do formulário \(b + w_1x_1 + w_2x_2\). Em outras palavras, o "superfície de decisão" não é uma linha.

No entanto, se realizarmos um cruzamento de atributos em nossos atributos $x_1$ e $x_2$, poderemos depois representam a relação não linear entre os dois atributos usando uma modelo linear: $b + w_1x_1 + w_2x_2 + w_3x_3$, em que $x_3$ é o cruzamento de atributos $x_1$ e $x_2$:

Figura 2. O mesmo plano de coordenadas cartesianos em azul e laranja
      pontos, como na Figura 1.  No entanto, desta vez uma curva hiperbólica branca
      plotado em cima da grade, que separa os pontos azuis no canto superior direito
      e quadrantes inferiores esquerdos (agora sombreados por um plano de fundo azul) de
      os pontos laranjas nos quadrantes superior esquerdo e inferior direito (agora
      sombreado com um fundo laranja).
Figura 2. Ao adicionar o cruzamento de atributos, x1x2, o modelo linear pode aprender uma forma hiperbólica que separa os pontos azuis dos pontos laranjas.

Agora considere o seguinte conjunto de dados:

Figura 3. Plano de coordenadas cartesiano, dividido em quatro quadrantes.
      Um aglomerado circular de pontos azuis está centralizado na origem do
      gráfico e cercado por um anel de pontos laranja.
Figura 3. Um problema de classificação não linear mais difícil.

Talvez você também se lembre dos exercícios de cruzamento de atributos que determinar os cruzamentos de atributos corretos para ajustar um modelo linear a esses dados exigia um pouco mais de esforço e experimentação.

Mas e se você não tivesse que fazer todos os experimentos por conta própria? Redes neurais são uma família de arquiteturas de modelo projetadas para encontrar não linear padrões nos dados. Durante o treinamento de uma rede neural, model automaticamente aprende os cruzamentos de atributos ideais para realizar nos dados de entrada para minimizar e perda de talentos.

Nas seções a seguir, vamos analisar mais de perto como as redes neurais funcionam.