クリケット(昆虫の種)は、寒い日より暑い日の方が頻繁に鳴ると言われています。何十年にもわたり、プロとアマチュアの科学者は、1 分あたりの気温と気温に関するデータをカタログ化してきました。ルースおばさんは、誕生日プレゼントとしてクリケットのデータベースを提供し、その関係を予測するためにモデルを学ぶよう求めています。 このデータを使用して、この関係について調べたいと考えています。
まず、データをプロットして調査します。
図 1. チャープ(1 分あたり)と温度(摂氏)の比較。
想定どおり、プロットはチャープ数に応じて温度が上昇しています。警告音と温度線形の関係はい。この関係を近似するため、次のような 1 本の直線を描画できます。
図 2. 直線的な関係です。
確かに、この線はすべてのドットを通過しませんが、チャープと温度の関係を明確に示しています。線の方程式を使用すると、この関係を次のように記述できます。
ここで
- \(y\) は摂氏(温度)です。これは予測しようとしている値です。
- \(m\) は、ラインの傾きです。
- \(x\) は、1 分あたりのチャープ数です。入力特徴の値です。
- \(b\) は y 切片です。
機械学習の慣例では、モデルの方程式は少し異なります。
ここで
- \(y'\) は、予測されるラベル(目的の出力)です。
- \(b\) はバイアス(y 切片)で、 \(w_0\)とも呼ばれます。
- \(w_1\) は、特徴 1 の重みです。重みは、ラインの従来の方程式にある「傾き」と同じ概念です。 \(m\)
- \(x_1\) は特徴(既知の入力)です。
1 分単位の新しいチャープ値の温度を推定(予測)するには、このモデルに \(x_1\) 値を置き換えるだけです。
このモデルは 1 つの特徴のみを使用しますが、より高度なモデルは複数の特徴に依存し、それぞれに別の重み(\(w_1\)、 \(w_2\)など)がある場合もあります。たとえば、3 つの特徴に依存するモデルは次のようになります。