このモジュールでは、線形回帰のコンセプトを紹介します。
線形回帰は、 変数間の関係を見つけるために使用される統計的手法。ML では、 線形回帰は単語間の関係を 機能と label。
たとえば、自動車の燃料効率をマイル/秒で予測するとします。 ガロンの重量に応じて次のように計算します。
ポンド(1,000 ポンド)(機能) | マイル/ガロン (ラベル) |
---|---|
3.5 | 18 |
3.69 | 15 |
3.44 | 18 |
3.43 | 16 |
4:34 | 15 |
442 | 14 |
2.37 | 24 |
これらの点をプロットすると、次のようなグラフになります。
図 1. 1 ガロンあたりの走行距離(ポンド単位)に対する自動車の重さ(ポンド単位)。たとえば、 車が重くなると、一般的に 1 ガロンあたりの走行距離(マイル)が低下します。
点を結ぶ最適な線を引くことで、独自のモデルを作成できます。
図 2. 前の図のデータから作成された最適な線。
線形回帰式
代数用語では、モデルは $ y = mx + b $
- $ y $ は 1 ガロンあたりのマイル、つまり予測したい値です。
- $ m $ は直線の傾きです。
- $ x $ はポンド(入力値)です。
- $ b $ は、y 切片です。
ML では、線形回帰モデルの方程式は次のように記述します。
ここで
- y ドル$ は予測ラベル、つまり出力です。
- $ b $ はバイアス 必要があります。バイアスは代数の y 切片と同じ概念で、 直線を求めることができますML では、バイアスは $ w_0 $ と呼ばれることもあります。バイアス モデルのパラメータ トレーニング中に計算されます。
- $ w_1 $ は、トレーニング データの重み 説明します。重みは代数の傾き $ m $ と同じ概念 直線を求めることができます重みは モデルのパラメータ 計算されます。
- $ x_1 $ は特徴量であり、 表示されます。
トレーニング中に、モデルは最適なモデルを生成する重みとバイアスを計算します。 モデルです。
図 3. 線形モデルの数学的表現。
この例では、作成した直線から重みとバイアスを計算します。「 bias は 30(直線が y 軸と交差する部分)、重みは -3.6( 直線の傾きなど)。この場合、このモデルは $ y' と定義されます。= 30 + (-3.6)(x_1) $ であり、 予測に使用できますたとえば、このモデルを使用すると、 4,000 ポンド(4,000 ポンド)の自動車の予測燃費は 15.6 マイル(15.6 マイル) ガロン。
図 4. このモデルを使用すると、4, 000 ポンド(4,000 ポンド)の自動車は 燃費性能は 1 ガロンあたり 15.6 マイルでした
複数の特徴を持つモデル
このセクションの例では、 より高度なモデルでは、複数の特徴、たとえば、 それぞれに異なる重み($ w_1 $、$ w_2 $ など)があります。たとえば 5 つの機能に依存する場合、次のように記述できます。
y ドル= b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $
たとえば、燃費を予測するモデルでは、さらに特徴量を 次に例を示します。
- 排気量
- 加速度
- シリンダー数
- 馬力
このモデルは次のように記述します。
図 5. 自動車の 1 ガロンあたりの走行距離を予測する 5 つの特徴を持つモデル 評価。
これらの追加特徴の一部をグラフ化すると、 ラベルとの直線関係、1 ガロンあたりのマイル数:
図 6. 自動車の排気量(立方センチメートル、1 ガロンあたりのマイル) 評価。自動車のエンジンが大きくなると、一般的に 1 ガロンあたりの走行距離(マイル)が計算される 低下します
図 7. 自動車の加速度とガロンあたりの走行マイル。車のキーとして 加速時間が長くなり、一般的に 1 ガロンあたりの走行距離が高くなります。
図 8. 自動車の馬力とガロンあたりのマイル数。車のキーとして 馬力が増加すると、一般的に 1 ガロンあたりの走行マイル数は低下します。