功能十字介紹
特徵是否跨部分使模型能符合非線性資料?如要確認,可以嘗試此運動。
工作:嘗試手動變更下列三個輸入特徵的權重,來建立將模型與橘色點分隔開來的模型:
如何手動變更體重:
- 按一下將 FeatureS 連線至 OUTPUT 的行。接著會出現輸入表單。
- 然後在該輸入表單中輸入浮點值。
- 按下 Enter 鍵。
請注意,此練習的介面不包含「步驟」按鈕。因為這個練習不會反覆訓練模型。
但您可以改為手動輸入「最後」的權重。
(答案會顯示在運動正下方。)
按一下答案的加號圖示。
- w1 = 0
- w2 = 0
- x1 x2 = 1 (或任何正值)
如果您輸入特徵交叉值的負值,模型會將藍點與橘色點分開,但預測結果完全不會出錯。
也就是說,模型會預測藍點的橘色,橘色則為預測藍色。
更多複雜的功能組合
現在,讓我們來加入一些進階的跨功能組合。
這個 Playground 資料集中設定的資料看起來像是飛鏢遊戲中的吵雜大聲、中間中間的藍點,以及外圍的橘色圓點。
按一下加號圖示即可查看模型視覺化說明。
每個 Playground 練習都會以視覺化方式呈現模型的目前狀態。以視覺呈現為例:
請留意下列視覺化模型:
- 每個軸代表一個特定特徵。以垃圾郵件而非垃圾郵件來說,這些功能可能是電子郵件的計數和收件者人數。
- 每個點都有一個資料範例的特徵值,例如電子郵件。
- 點的顏色代表範例所屬的類別。舉例來說,藍點代表非垃圾郵件,而橘色點則代表垃圾郵件。
- 背景顏色代表模型的找到位置範例的預測結果。藍點周圍的藍色背景表示模型已正確預測該範例。反之,藍點周圍的橘色背景則代表模型未正確預測該範例。
- 背景藍色和橘色都會縮放。舉例來說,視覺呈現的左側是恆亮藍色,但在視覺呈現的中央會逐漸淡出到白色。您可以將顏色強度視為一種指標,表示模型的猜測有信心。藍色實線代表模型對其猜測有信心,而淺藍色則代表模型的可信度較低。(如圖所示的模型視覺化作業效能低落)。
以視覺化的方式呈現模型的進展。
(「極佳」) - 大部分藍點會以藍色背景表示,也就是「否」。藍點背景為橘色。)除了色彩之外,Playground 還會顯示模型的目前損失。(啊喔!損失的波動而非逐漸下降。」)
工作 1:執行指定的線性模式。建議您花一兩分鐘 (但更短) 嘗試不同的學習率設定,看看是否能夠改善。線性模型可以為這個資料集產生有效結果嗎?
工作 2:現在,嘗試在跨產品功能 (例如 x1x2) 中新增以嘗試提高成效。
- 哪些功能最有幫助?
- 請問您能以何種方式取得最佳效能?
工作 3:當您擁有良好的模型時,請檢查模型輸出介面 (以背景顏色顯示)。
- 看起來像線性線嗎?
- 你會如何描述這個模型?
(答案會顯示在運動正下方。)
按一下工作 1 答案的加號圖示。
否。線性模型無法有效模擬這個資料集的模型。降低學習率可減少損失,但損失值仍應以可接受的高值融合。
按一下加號圖示來取得工作 2 的答案。
Playground 的資料集會隨機產生。因此,您的答案不一定與您完全一致。事實上,如果您在執行之間重新產生資料集,則自己的結果不一定會完全與您先前的執行結果完全一致。但藉由執行下列步驟,即可獲得更好的結果:
-
使用 x12 和 x22 做為功能交錯處。(新增 x1x2 做為特徵跨元素) 似乎沒有幫助。)
-
降低「學習率」,可能為「0.001」。