Como quizás recuerdes del Ejercicios de combinación de atributos En el módulo Datos categóricos, que el siguiente problema de clasificación no es lineal:
"No lineal" significa que no se puede predecir con exactitud una etiqueta con una con el formato \(b + w_1x_1 + w_2x_2\). En otras palabras, el “superficie de decisión” no es una línea.
Sin embargo, si hacemos una combinación de atributos en los atributos $x_1$ y $x_2$, podemos luego representar la relación no lineal entre los dos atributos con un modelo lineal: $b + w_1x_1 + w_2x_2 + w_3x_3$, donde $x_3$ es la combinación de atributos $x_1$ y $x_2$:
Ahora, considera el siguiente conjunto de datos:
Es posible que también lo recuerdes de los ejercicios de combinación de atributos. que determinar las combinaciones de atributos correctas para ajustar un modelo lineal a estos datos requería un poco más de esfuerzo y experimentación.
Pero ¿qué sucede si no tuvieras que hacer toda esa experimentación tú mismo? Las redes neuronales son un conjunto de arquitecturas de modelos diseñadas para encontrar no lineal patrones en los datos. Durante el entrenamiento de una red neuronal, el model automáticamente las combinaciones de atributos óptimas para realizar en los datos de entrada a fin de minimizar pérdida de reputación y de talento.
En las siguientes secciones, analizaremos con más detalle cómo funcionan las redes neuronales.