로지스틱 회귀: 시그모이드 함수로 확률 계산

많은 문제에 확률 추정치가 출력으로 필요합니다. 로지스틱 회귀는 확률을 계산하는 매우 효율적인 메커니즘입니다. 실질적으로 다음 중 하나에서 반환된 확률을 사용할 수 있습니다. 두 가지 방법:

  • '있는 그대로' 적용됩니다. 예를 들어 스팸 예측 모델이 이메일을 0.932 값을 입력하고 출력하는 경우 이 예측값은93.2% 스팸 메일입니다.

  • 바이너리 카테고리로 전환됨 (예: True, False, Spam, Not Spam)

이 모듈에서는 로지스틱 회귀 모델 출력을 있는 그대로 사용하는 데 중점을 둡니다. 분류 모듈에서는 출력을 이진 카테고리로 변환합니다.

시그모이드 함수

로지스틱 회귀 모델이 로지스틱 회귀 모델의 출력과 확률을 나타내며 항상 0과 1 사이의 값을 출력합니다. 그대로 로지스틱 함수라고 하는 함수군이 있습니다. 그 출력의 특성이 동일한지 확인하세요 표준 로지스틱 함수인 일명 시그모이드 함수 (시그모이드는 's자형'을 의미), 공식:

\[f(x) = \frac{1}{1 + e^{-x}}\]

그림 1은 이에 상응하는 시그모이드 함수의 그래프를 보여줍니다.

시그모이드 (s자형) 곡선을 데카르트 좌표 평면에 표현
         원점을 중심으로 합니다.
그림 1. 시그모이드 함수의 그래프입니다. 곡선이 0에 근접 x 값이 음의 무한대로 감소하고 1이 x로 감소함 값은 무한대를 향해 증가합니다.

입력 x가 증가하면 시그모이드 함수의 출력이 접근합니다. 1에 도달하지 못합니다. 마찬가지로 입력이 감소하면 시그모이드가 함수의 출력이 가까워지지만 0에 도달하지는 않습니다.

여기를 클릭하여 수학에 대해 더 자세히 알아보세요. 시그모이드 함수 이면에 있는

아래 표는 주어진 입력 시퀀스에 대한 시그모이드 함수 입력 값을 선택할 수 있습니다. 시그모이드가 얼마나 빨리 0: 음수 입력값 감소 및 시그모이드에 접근하는 속도 1: 양수 입력 값을 증가시키는 경우

그러나 입력 값이 얼마나 크거나 작든 상관없이 항상 0보다 크고 1보다 작아야 합니다.

입력 시그모이드 출력
-7 0.001
-6 0.002
-5 0.007
-4 0.018
-3 0.047
-2 0.119
-1 0.269
0 0.50
1 0.731
2 0.881
3 0.952
4 0.982
5 0.993
6 0.997
7 0.999달러

시그모이드 함수를 사용하여 선형 출력 변환

다음 방정식은 로지스틱의 선형 구성요소를 나타냅니다. 회귀 모델:

\[z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N\]

각 항목의 의미는 다음과 같습니다.

  • z는 선형 방정식의 출력이며 로그 확률.
  • b는 편향입니다.
  • w 값은 모델의 학습된 가중치입니다.
  • x 값은 특정 예에 대한 특성 값입니다.

로지스틱 회귀 예측을 얻기 위해 z 값이 0과 1 사이의 값 (확률)을 산출하는 시그모이드 함수입니다.

\[y' = \frac{1}{1 + e^{-z}}\]

각 항목의 의미는 다음과 같습니다.

  • y'는 로지스틱 회귀 모델의 출력입니다.
  • z는 (위 방정식에서 계산한) 선형 출력입니다.

여기를 클릭하여 로그 오즈

방정식에서 $z = b + w_1x_1 + w_2x_2 + \ldots + w_Nx_N$, z 로그 오즈라고 합니다. 시그모이드 함수 ($y$ 는 로지스틱의 출력) 확률을 나타내는 회귀 모델).

$$y = \frac{1}{1 + e^{-z}}$$

그런 다음 z를 풉니다.

$$ z = \log\left(\frac{y}{1-y}\right) $$

그런 다음 z는 확률의 비율 로그로 정의됩니다. y1 – y의 결과를 나타냅니다.

그림 2는 선형 출력이 로지스틱 회귀로 변환되는 방식을 보여줍니다. 출력됩니다.

왼쪽: 점 (-7.5, –10), (-2.5, 0), (0, 5)가 있는 선
         강조표시됩니다. 오른쪽: 변환된 시그모이드 곡선
         점 (-10, 0.00004), (0, 0.5), (5, 0.9933)이 강조 표시되어 있습니다.
그림 2. 왼쪽: 3이 적용된 선형 함수 z = 2x + 5의 그래프 강조 표시됩니다. 오른쪽: 동일한 세 점을 가진 시그모이드 곡선 시그모이드 함수로 변환된 후 강조 표시됩니다.

그림 2에서 선형 방정식이 시그모이드 함수에 입력되면 직선을 S자 모양으로 구부리게 합니다. 선형 방정식은 매우 크거나 작은 z 값을 출력할 수 있지만 시그모이드의 출력은 함수 y'는 항상 0과 1 사이(양 끝값 제외)입니다. 예를 들어 주황색 그래프에서 직사각형의 z 값은 -10이지만 -10을 y'로 매핑하는 올바른 그래프 0.00004로 설정합니다.

연습문제: 학습 내용 점검하기

특성이 3개인 로지스틱 회귀 모델에는 다음과 같은 편향이 있으며 가중치:

\[\begin{align} b &= 1 \\ w_1 &= 2 \\ w_2 &= -1 \\ w_3 &= 5 \end{align} \]

다음과 같은 입력 값이 주어졌습니다.

\[\begin{align} x_1 &= 0 \\ x_2 &= 10 \\ x_3 &= 2 \end{align} \]

다음 두 질문에 답하세요.

1. 이러한 입력 값에 대한 z 값은 무엇인가요?
-1
0
0.731
1
정답입니다. 가중치와 편향으로 정의되는 선형 방정식은 다음과 같습니다. z = 1 + 2x1 – x2 + 5 x3입니다. 전원 입력하면 z = 1 + (2)(0) - (10) + (5)(2) = 1이 됩니다.
2. 이러한 입력 값의 로지스틱 회귀 예측이란 무엇인가요?
0.268
0.5
0.731

위의 1번에서 계산한 대로 입력 값의 로그 오즈는 1입니다. 이 z 값을 시그모이드 함수에 연결합니다.

\(y = \frac{1}{1 + e^{-z}} = \frac{1}{1 + e^{-1}} = \frac{1}{1 + 0.367} = \frac{1}{1.367} = 0.731\)

1
시그모이드 함수의 출력은 항상 0보다 크고 1보다 작은 숫자입니다.