선형 회귀

이 모듈에서는 선형 회귀 개념을 소개합니다.

를 통해 개인정보처리방침을 정의할 수 있습니다.

선형 회귀는 변수 간의 관계를 찾는 데 사용되는 통계 기법입니다. ML 선형 회귀는 예측 확률 분포와 features라벨을 포함할 수도 있습니다.

예를 들어, 자동차의 1km당 연비를 예측하고 싶다고 가정하면 갤런을 기준으로 하며 다음과 같은 데이터 세트가 있습니다.

1000파운드 단위 (특징) 갤런당 마일 (라벨)
3.5 18
3.69 15
3.44 18
3.43 16
4.34 15
4.42 14
2.37 24

이 점을 그래프로 나타내면 다음과 같은 그래프를 얻게 됩니다.

그림 1. 왼쪽에서 오른쪽으로 하향 추세를 보이는 데이터 포인트입니다.

그림 1. 차량 무게 (파운드)와 갤런 평가당 마일 비교. 자동차가 무거워지고 갤런당 주행 거리가 일반적으로 줄어듭니다.

점을 통해 가장 적합한 선을 그려 자체 모델을 만들 수 있습니다.

그림 2. 모델을 나타내는 가장 적합한 선이 그려진 데이터 포인트

그림 2. 이전 그림의 데이터를 통해 그려진 최적선

선형 회귀 방정식

이 모델은 대수적으로 표현하면 $ y = mx + b $로 정의됩니다.

  • $ y $ 는 갤런당 마일, 즉 예측하고자 하는 값입니다.
  • $ m $ 은 선의 기울기입니다.
  • $ x $ 는 파운드(입력 값)입니다.
  • $ b $ 는 y절편입니다.

ML에서는 다음과 같이 선형 회귀 모델의 방정식을 작성합니다.

$$ y' = b + w_1x_1 $$

각 항목의 의미는 다음과 같습니다.

  • $ y' $ 는 예측된 라벨(출력)입니다.
  • $ b $ 는 편향입니다. 모델의 성능을 평가합니다. 편향은 대수학의 y절편과 동일한 개념입니다. 나타냅니다. ML에서는 편향을 $ w_0 $라고도 합니다. 편향성 모델의 매개변수입니다. 학습 중에 계산됩니다.
  • $ w_1 $ 는 대상의 가중치입니다. 기능을 사용할 수 있습니다. 가중치는 대수학에서 기울기 $ m $ 과 같은 개념입니다. 나타냅니다. 가중치는 모델의 매개변수입니다. 계산됩니다.
  • $ x_1 $ 는 기능입니다. 있습니다.

학습 중에 모델은 가장 좋은 결과를 내는 가중치와 편향을 계산하여 있습니다.

그림 3. 방정식 y' 각 구성요소에 용도가 주석으로 표시되어 있습니다.

그림 3. 선형 모델의 수학적 표현.

이 예에서는 그리는 선에서 가중치와 편향을 계산합니다. 이 편향은 30 (직선이 y축과 교차하는 부분)이고 가중치는 -3.6( 선의 경사도). 모델은 $ y'로 정의됩니다. = 30 + (-3.6)(x_1) $와 예측을 수행하는 데 사용할 수 있습니다. 예를 들어 이 모델을 사용하면 4,000파운드짜리 자동차의 예상 연비는 15.6마일입니다. 갤런입니다.

그림 4. 그림 2와 동일한 그래프에 점 (4, 15.6)이 강조 표시되어 있습니다.

그림 4. 이 모델을 사용하여 4,000파운드의 자동차는 연비는 갤런당 25.6마일입니다.

여러 특성을 가진 모델

이 섹션의 예에서는 한 가지 기능(무거움)만 사용하지만 즉, 보다 정교한 모델은 여러 기능에 의존할 수 있지만, 각각 별도의 가중치를 갖습니다 ($ w_1 $, $ w_2 $ 등). 예를 들어 모델은 는 다음과 같이 작성됩니다.

$ y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $

예를 들어 연비를 예측하는 모델은 추가로 특성을 사용할 수 있습니다. 다음과 같습니다.

  • 엔진 배기량
  • 가속력
  • 원통 수
  • 마력

이 모델은 다음과 같이 작성할 수 있습니다.

그림 5. 다섯 가지 특성을 갖는 선형 회귀 방정식입니다.

그림 5. 갤런당 자동차의 마일을 예측하는 5개의 특성이 있는 모델 평점

이러한 추가 특성 중 일부를 그래프로 표현하면 라벨에 대한 선형 관계, 갤런당 마일:

그림 6. 갤런당 마일에 대한 세제곱 센티미터 단위의 변위는 음의 선형 관계를 보여줍니다.

그림 6. 차량의 변위(세제곱 센티미터 및 갤런당 마일) 평점 자동차 엔진이 커질수록 일반적으로 갤런당 주행 거리가 커짐 감소합니다.

그림 7. 0초에서 60초 사이의 가속도를 갤런당 마일에 대해 그래프로 나타낸 것입니다. 이는 양의 선형 관계를 보여줍니다.

그림 7. 자동차의 가속 및 갤런 평가당 마일입니다. 자동차의 더 오래 걸리는 경우 일반적으로 갤런당 주행 거리가 증가합니다.

그림 8. 마력은 갤런당 마일에 대한 음의 선형 관계를 나타내는 그래프로 표시됩니다.

그림 8. 자동차의 마력과 갤런당 거리(마일)입니다. 자동차의 마력이 증가하면 일반적으로 갤런당 마일은 감소합니다.

연습문제: 학습 내용 점검하기

선형 회귀 방정식에서 학습 중에 업데이트되는 부분은 무엇인가요?
편향 및 가중치
학습 중에 모델은 편향을 업데이트하고 가중치를 할당합니다.
예측
학습 중에는 예측이 업데이트되지 않습니다.
특성값은
특성 값이 데이터 세트의 일부이므로 업데이트되지 않습니다. 학습합니다.