以下簡要列出您在課程中學到的內容:
- 決策樹是一種模型 包含一組 分類條件 形成樹狀結構的樹狀結構。條件屬於多種因素 類別:
- 訓練決策樹狀圖時,需要在 每個節點Splitter 處理常式 使用「資訊」等指標 增加或 運用 Gini 找出最佳方案 值。
- 決策樹系是 由多項決策樹構成決策樹系的預測結果 是由決策樹所預測結果的匯總函式
- 隨機森林是 單一決策樹狀圖,其中每個決策樹狀圖都以 特定隨機雜訊
- Bagging 是 隨機樹系中的每個決策樹都以不同的子集訓練 參考範例
- 隨機樹係不需要驗證資料集。相反地 森林是運用稱為 out-of-bag-evaluation 用來評估模型品質
- 梯度提升 (決策) 樹木 是一種決策樹,透過根據輸入內容不斷調整 做出決定名為 shrinkage 可控制 強調一個梯度增強 (決策) 樹所學到的知識,以及其學習程度 可能會過度配適
參考資料
- 灰色函式近似函式:漸層提升 機器 的Friedman。
- 統計要素 學習 Trevor Hastie。第 10 章:
- 通用強化版模型:gbm 指南 套件 登機門:Ridgeway