Логистическая регрессия: вычисление вероятности с помощью сигмовидной функции

Многие задачи требуют на выходе оценки вероятности. Логистическая регрессия — чрезвычайно эффективный механизм расчета вероятностей. Практически говоря, вы можете использовать возвращаемую вероятность одним из следующих двух способов:

  • Применяется «как есть». Например, если модель прогнозирования спама принимает электронное письмо в качестве входных данных и выводит значение 0.932 , это подразумевает вероятность 93.2% , что электронное письмо является спамом.

  • Преобразуется в двоичную категорию , например True или False , Spam или Not Spam .

В этом модуле основное внимание уделяется использованию выходных данных модели логистической регрессии «как есть». В модуле «Классификация» вы узнаете, как преобразовать эти выходные данные в двоичную категорию.

Сигмовидная функция

Вам может быть интересно, как модель логистической регрессии может гарантировать, что ее выходные данные представляют собой вероятность, всегда выдавая значение от 0 до 1. На самом деле существует семейство функций, называемых логистическими функциями, выходные данные которых имеют те же характеристики. Стандартная логистическая функция, также известная как сигмовидная функция ( сигмовидная означает «s-образная»), имеет формулу:

f(x)=11+ex

На рис. 1 показан соответствующий график сигмовидной функции.

Сигмовидная (s-образная) кривая, построенная на декартовой координатной плоскости с центром в начале координат.
Рисунок 1. График сигмовидной функции. Кривая приближается к 0, когда значения x уменьшаются до отрицательной бесконечности, и к 1, когда значения x увеличиваются до бесконечности.

По мере увеличения входного значения x выходной сигнал сигмовидной функции приближается, но никогда не достигает 1 . Точно так же, когда входные данные уменьшаются, выходные данные сигмовидной функции приближаются, но никогда не достигают 0 .

В таблице ниже показаны выходные значения сигмовидной функции для входных значений в диапазоне от –7 до 7. Обратите внимание, как быстро сигмоида приближается к 0 для уменьшения отрицательных входных значений и как быстро сигмоида приближается к 1 для увеличения положительных входных значений.

Однако независимо от того, насколько велико или мало входное значение, выходное значение всегда будет больше 0 и меньше 1.

Вход Сигмовидный выход
-7 0,001
-6 0,002
-5 0,007
-4 0,018
-3 0,047
-2 0,119
-1 0,269
0 0,50
1 0,731
2 0,881
3 0,952
4 0,982
5 0,993
6 0,997
7 0,999

Преобразование линейного выхода с помощью сигмовидной функции

Следующее уравнение представляет линейный компонент модели логистической регрессии:

z=b+w1x1+w2x2++wNxN

где:

  • z — результат линейного уравнения, также называемый логарифмом шансов .
  • б – смещение.
  • Значения w представляют собой изученные веса модели.
  • Значения x — это значения признаков для конкретного примера.

Чтобы получить прогноз логистической регрессии, значение z затем передается сигмовидной функции, что дает значение (вероятность) от 0 до 1:

y=11+ez

где:

  • y' — результат модели логистической регрессии.
  • z — линейный выход (рассчитанный в предыдущем уравнении).

В уравнении z=b+w1x1+w2x2++wNxN z называется логарифмом шансов , потому что если вы начнете со следующей сигмовидной функции (где y — результат модели логистической регрессии, представляющий вероятность):

y=11+ez

А затем решите для z :

z=log(y1y)

Тогда z определяется как логарифм отношения вероятностей двух возможных исходов: y и 1 – y .

На рисунке 2 показано, как линейный результат преобразуется в результат логистической регрессии с помощью этих вычислений.

Слева: линия с выделенными точками (-7,5, –10), (-2,5, 0) и (0, 5). Справа: сигмовидная кривая с выделенными соответствующими преобразованными точками (-10, 0,00004), (0, 0,5) и (5, 0,9933).
Рисунок 2. Слева: график линейной функции z = 2x + 5, выделены три точки. Справа: сигмовидная кривая с теми же тремя точками, выделенными после преобразования сигмовидной функцией.

На рисунке 2 линейное уравнение становится входными данными для сигмоидальной функции, которая изгибает прямую линию в S-образную форму. Обратите внимание, что линейное уравнение может выводить очень большие или очень маленькие значения z, но выходные данные сигмоидальной функции y' всегда находятся в диапазоне от 0 до 1, исключая. Например, оранжевый прямоугольник на левом графике имеет значение az -10, но сигмовидная функция на правом графике отображает это значение -10 в значение y', равное 0,00004.

Упражнение: Проверьте свое понимание.

Модель логистической регрессии с тремя функциями имеет следующие смещения и веса:

b=1w1=2w2=1w3=5

Учитывая следующие входные значения:

x1=0x2=10x3=2

Ответьте на следующие два вопроса.

1. Каково значение z для этих входных значений?
–1
0
0,731
1
2. Каков прогноз логистической регрессии для этих входных значений?
0,268
0,5
0,731
1