深入機器學習:線性迴歸

一直以來,我們發現板球 (昆蟲物種) 的熱度在較冷的日子更頻繁。數十年來,專業和業餘的科學家以每分鐘心跳和溫度的分類資料為依據。做為生日禮物,Aunt Ruth 將提供她的板球資料庫,並讓你學習模型來預測這種關係。 您可以運用這項資料探索這種關係。

首先,透過繪製資料來檢查資料:

原始時鐘/分鐘 (x 軸) 和溫度 (y 軸) 的原始資料。

圖 1. 每分鐘的晶片數量與攝氏的溫度。

正如預期中,圖顯示溫度隨聲道數上升。 你們的口頭與溫度之間的關係為何?可以。您可以依照下方的類似方式繪製單一直線,推斷這種關係:

最佳的線索/分鐘 (x 軸) 與溫度 (y 軸) 之間的關係。

圖 2. 線性關係。

沒錯,該線條不會經過每個點,但該線條清楚清楚顯示了色盲與溫度之間的關係。使用一行的方程式,您可以按照以下方式編寫關係:

$$ y = mx + b $$

其中:

  • \(y\) 是攝氏溫度,也就是我們嘗試預測的值。
  • \(m\) 是線條的斜坡。
  • \(x\) 是每分鐘的方塊數 (也就是輸入功能的數值)。
  • \(b\) 是 Y 截距。

按照機器學習慣例,您會編寫模型的算式略有不同:

$$ y' = b + w_1x_1 $$

其中:

  • \(y'\) 是預測的標籤 (所需輸出內容)。
  • \(b\) 是偏誤 (Y 截距),有時也稱為 \(w_0\)。
  • \(w_1\) 是特徵 1 的權重。權重與傳統的傳統方程式中「斜坡」 \(m\) 的概念相同。
  • \(x_1\) 是功能 (已知的輸入內容)。

如要推論 (預測) 新的每分鐘心跳值 \(y'\) 的溫度 \(x_1\),只要將 \(x_1\) 值替換為此模型即可。

雖然這個模型只使用一項特徵,但更複雜的模型可能仰賴多個特徵,而且每個函式都有不同的權重 (\(w_1\)、 \(w_2\)等)。例如,依賴三個特徵的模型可能如下所示:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$