線形回帰

このモジュールでは、線形回帰のコンセプトを紹介します。

線形回帰は、 変数間の関係を見つけるために使用される統計的手法。ML では、 線形回帰は単語間の関係を 機能label

たとえば、自動車の燃料効率をマイル/秒で予測するとします。 ガロンの重量に応じて次のように計算します。

ポンド(1,000 ポンド)(機能) マイル/ガロン (ラベル)
3.5 18
3.69 15
3.44 18
3.43 16
4:34 15
442 14
2.37 24

これらの点をプロットすると、次のようなグラフになります。

図 1. データポイントは、左から右へと下降傾向を示しています。

図 1. 1 ガロンあたりの走行距離(ポンド単位)に対する自動車の重さ(ポンド単位)。たとえば、 車が重くなると、一般的に 1 ガロンあたりの走行距離(マイル)が低下します。

点を結ぶ最適な線を引くことで、独自のモデルを作成できます。

図 2. モデルを表す最適線が引かれたデータポイント。

図 2. 前の図のデータから作成された最適な線。

線形回帰式

代数用語では、モデルは $ y = mx + b $

  • $ y $ は 1 ガロンあたりのマイル、つまり予測したい値です。
  • $ m $ は直線の傾きです。
  • $ x $ はポンド(入力値)です。
  • $ b $ は、y 切片です。

ML では、線形回帰モデルの方程式は次のように記述します。

$$ y' = b + w_1x_1 $$

ここで

  • y ドル$ は予測ラベル、つまり出力です。
  • $ b $ はバイアス 必要があります。バイアスは代数の y 切片と同じ概念で、 直線を求めることができますML では、バイアスは $ w_0 $ と呼ばれることもあります。バイアス モデルのパラメータ トレーニング中に計算されます。
  • $ w_1 $ は、トレーニング データの重み 説明します。重みは代数の傾き $ m $ と同じ概念 直線を求めることができます重みは モデルのパラメータ 計算されます。
  • $ x_1 $ は特徴量であり、 表示されます。

トレーニング中に、モデルは最適なモデルを生成する重みとバイアスを計算します。 モデルです。

図 3. 方程式 y'= b + w1x1 です。各コンポーネントにはその目的がアノテーションされています。

図 3. 線形モデルの数学的表現。

この例では、作成した直線から重みとバイアスを計算します。「 bias は 30(直線が y 軸と交差する部分)、重みは -3.6( 直線の傾きなど)。この場合、このモデルは $ y' と定義されます。= 30 + (-3.6)(x_1) $ であり、 予測に使用できますたとえば、このモデルを使用すると、 4,000 ポンド(4,000 ポンド)の自動車の予測燃費は 15.6 マイル(15.6 マイル) ガロン。

図 4. 図 2 と同じグラフで、ポイント(4、15.6)がハイライト表示されています。

図 4. このモデルを使用すると、4, 000 ポンド(4,000 ポンド)の自動車は 燃費性能は 1 ガロンあたり 15.6 マイルでした

複数の特徴を持つモデル

このセクションの例では、 より高度なモデルでは、複数の特徴、たとえば、 それぞれに異なる重み($ w_1 $、$ w_2 $ など)があります。たとえば 5 つの機能に依存する場合、次のように記述できます。

y ドル= b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $

たとえば、燃費を予測するモデルでは、さらに特徴量を 次に例を示します。

  • 排気量
  • 加速度
  • シリンダー数
  • 馬力

このモデルは次のように記述します。

図 5. 5 つの特徴を持つ線形回帰式。

図 5. 自動車の 1 ガロンあたりの走行距離を予測する 5 つの特徴を持つモデル 評価。

これらの追加特徴の一部をグラフ化すると、 ラベルとの直線関係、1 ガロンあたりのマイル数:

図 6. 立方センチメートルの変位を 1 ガロンあたりのマイル数に対してグラフ化し、負の直線関係を示します。

図 6. 自動車の排気量(立方センチメートル、1 ガロンあたりのマイル) 評価。自動車のエンジンが大きくなると、一般的に 1 ガロンあたりの走行距離(マイル)が計算される 低下します

図 7. 0 から 60 秒の加速度を 1 ガロンあたりのマイル数に対してグラフ化し、正の直線関係を示します。

図 7. 自動車の加速度とガロンあたりの走行マイル。車のキーとして 加速時間が長くなり、一般的に 1 ガロンあたりの走行距離が高くなります。

図 8. 1 ガロンあたりの走行マイル数に対する馬力のグラフ。負の直線関係を示します。

図 8. 自動車の馬力とガロンあたりのマイル数。車のキーとして 馬力が増加すると、一般的に 1 ガロンあたりの走行マイル数は低下します。

演習:理解度をチェックする

線形回帰式のどの部分がトレーニング中に更新されますか。
バイアスと重み
トレーニング中にモデルはバイアスを更新して、 損失に基づく重みです。
予測
予測はトレーニング中に更新されません。
特徴値
特徴値はデータセットの一部であるため、更新されない 必要があります。