로지스틱 회귀는 정확히 0 또는 1을 예측하는 대신 확률을 생성합니다. 값은 0과 1 사이입니다(제외). 예를 들어 스팸 감지를 위한 로지스틱 회귀 모델이 있다고 가정해 보겠습니다. 모델이 특정 이메일 메시지에서 0.932 값을 추론하는 경우 이메일 메시지가 스팸일 확률이 93.2% 입니다. 더 정확하게 말하면 무한 학습 수 한도에서 모델이 0.932로 예측하는 일련의 사례는 실제로 스팸이 93.2% 이고 나머지 6.8% 는 스팸이 아닙니다.
로지스틱 회귀
동전 던지기 예측
구부러진 동전의 앞면이 나올 확률을 예측하는 문제를 생각해 보세요.
구부러진 각도, 동전의 질량 등과 같은 특성을 사용할 수 있습니다.
사용할 수 있는 가장 간단한 모델은 무엇인가요?
어떤 문제가 발생할 수 있을까요?
로지스틱 회귀
많은 문제에 출력 확률을 사용합니다.
로지스틱 회귀를 입력합니다.
로지스틱 회귀
많은 문제에 출력 확률을 사용합니다.
로지스틱 회귀를 입력합니다.
확률 근사치가 보정되기 때문에 편리합니다.
예: p(주택 판매) * price = 예상 결과
로지스틱 회귀
많은 문제에 출력 확률을 사용합니다.
로지스틱 회귀를 입력합니다.
확률 근사치가 보정되므로 편리합니다.
예: p(주택 판매) * price = 예상 결과
이진 분류가 필요한 경우에도 유용
스팸 여부 → p(스팸)
로지스틱 회귀 -- 예측
$$ y' = \frac{1}{1 + e^{-(w^Tx+b)}} $$
\(\text{Where:} \)
\(x\text{: Provides the familiar linear model}\)
\(1+e^{-(...)}\text{: Squish through a sigmoid}\)