Regresión logística: calcular una probabilidad

Muchos problemas requieren una estimación de probabilidad como resultado. La regresión logística es un mecanismo extremadamente eficiente para calcular las probabilidades. En términos prácticos, puedes usar la probabilidad que se muestra de cualquiera de las siguientes dos maneras:

  • "Tal como está"
  • Se convirtió en una categoría binaria.

Consideremos cómo podemos usar la probabilidad “tal como está”. Supongamos que creamos un modelo de regresión logística para predecir la probabilidad de que un perro ladre durante la noche. A esa probabilidad la llamaremos:

\[p(bark | night)\]

Si el modelo de regresión logística predice \(p(bark | night) = 0.05\), el propietario de un perro deberá despertarse durante aproximadamente un año aproximadamente 18 veces:

\[\begin{align} startled &= p(bark | night) \cdot nights \\ &= 0.05 \cdot 365 \\ &~= 18 \end{align} \]

En muchos casos, asignarás el resultado de la regresión logística a la solución a un problema de clasificación binaria, en el que el objetivo es predecir correctamente una de dos etiquetas posibles (p.ej., "spam" o &no es spam? Un módulo posterior se enfoca en eso.

Es posible que te preguntes cómo un modelo de regresión logística puede garantizar un resultado que siempre se encuentre entre 0 y 1. A medida que sucede, una función sigmoidea, definida de la siguiente manera, produce resultados que tienen esas mismas características:

$$y = \frac{1}{1 + e^{-z}}$$

La función sigmoidea genera la siguiente representación:

Función sigmoidea. El eje x es el valor de inferencia sin procesar. El eje y se extiende de 0 a +1, exclusivo.

Figura 1: Función sigmoidea.

Si \(z\) representa el resultado de la capa lineal de un modelo entrenado con regresión logística, \(sigmoid(z)\) producirá un valor (una probabilidad) entre 0 y 1. En términos matemáticos:

$$y' = \frac{1}{1 + e^{-z}}$$

Donde:

  • \(y'\) es el resultado del modelo de regresión logística para un ejemplo en particular.
  • \(z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\)
    • Los valores \(w\) son los pesos aprendidos del modelo y \(b\) es el sesgo.
    • Los valores \(x\) son los valores de atributo para un ejemplo en particular.

Ten en cuenta que \(z\) también se conoce como probabilidades de registro porque lo inverso de los estados sigmoideos \(z\) se puede definir como el registro de la probabilidad de la etiqueta \(1\) (p.ej., &perro ladrando" dividido por la probabilidad de la etiqueta \(0\)(p.ej., "perro no ladra"):

$$ z = \log\left(\frac{y}{1-y}\right) $$

Esta es la función sigmoidea con las etiquetas de AA:

La función sigmoidea con el eje x etiquetado como la suma de todos los pesos y atributos (más el sesgo); el eje y se etiqueta como resultado de probabilidad.

Figura 2: Resultado de la regresión logística