Datos numéricos: Transformaciones polinómicas

A veces, cuando el profesional del AA tiene conocimientos del dominio que sugieren que una variable está relacionada con el cuadrado, el cubo u otra potencia de otra variable, es útil crear una atributo sintético de uno de los atributos numéricos existentes.

Considera la siguiente distribución de puntos de datos, donde los círculos rosados representan una clase o categoría (por ejemplo, una especie de árbol) y triángulos verdes otra clase (o especie de árbol):

Figura 17: Expansión de puntos de datos en y=x^2, con triángulos debajo de
            y círculos sobre la curva.
Figura 17: Dos clases que no se pueden separar por una línea.

No es posible dibujar una línea recta que separe completamente los dos pero es posible dibujar una curva que lo haga:

Figura 18. La misma imagen que la Figura 17, solo que esta vez con y=x^2
            superpuestos para crear un límite claro entre los triángulos y
            en los círculos.
Figura 18: Separar las clases con y = x2

Como se explicó en el Módulo de regresión lineal, un modelo lineal con un atributo, $x_1$, se describe mediante la ecuación lineal:

$$y = b + w_1x_1$$

Las funciones adicionales se controlarán mediante la incorporación de las condiciones \(w_2x_2\), \(w_3x_3\), etcétera

El descenso de gradientes encuentra la peso $w_1$ (o pesos \(w_1\), \(w_2\), \(w_3\), en el caso de funciones adicionales) que minimiza la pérdida del modelo. Pero los puntos de datos que se muestran no pueden estar separados por una línea. ¿Qué puedo hacer?

Es posible mantener la ecuación lineal y permitir la no linealidad Para ello, define un nuevo término, \(x_2\), que simplemente está \(x_1\) al cuadrado:

$$x_2 = x_1^2$$

Este atributo sintético, llamado transformación polinómica, se trata como cualquier con otra función. La fórmula lineal anterior se convierte en lo siguiente:

$$y = b + w_1x_1 + w_2x_2$$

De todos modos, esto se puede tratar como un regresión lineal problema y los pesos determinados a través del descenso de gradientes, como de costumbre, a pesar de que contiene un término cuadrático oculto, la transformación polinomial. Sin realizar cambios cómo se entrena el modelo lineal, la adición de una transformación polinomial permite para separar los datos usando una curva del formulario $y = b + w_1x + w2x^2$.

Por lo general, el atributo numérico de interés se multiplica por sí mismo, es decir, elevado a algo de poder. A veces, un profesional del AA puede suponer una suposición fundamentada sobre el exponente apropiado. Por ejemplo, muchas relaciones en el mundo físico mundo se relacionan con los términos al cuadrado, incluida la aceleración debido a la gravedad, la atenuación de la luz o el sonido a la distancia y energía potencial elástica.

Un concepto relacionado en Los datos categóricos son la combinación de atributos, que más suele sintetizar dos funciones diferentes.