本單元著重介紹用於建構決策的各種條件 樹木
軸對齊與斜體條件
軸對齊 條件只包含一個特徵。一個斜角 條件包含多個特徵舉例來說, 軸對齊條件:
num_legs ≥ 2
雖然下列情況為斜式:
num_legs ≥ num_fingers
決策樹通常只用軸對齊條件進行訓練。不過 斜角分割法更為強大,因為能呈現更複雜的 例如模式跳躍式分裂有時會產生更好的結果 訓練與推論成本較高
YDF 代碼
在 YDF 中,系統預設會以軸對齊條件訓練決策樹。
您可以透過
split_axis="SPARSE_OBLIQUE"
參數。
圖 4.以軸對齊的條件和斜角條件範例。 ,瞭解如何調查及移除這項存取權。
以圖形呈現上述兩個條件會產生以下特徵空間 區隔:
圖 5.圖 4 中條件的特徵空間分隔。 ,瞭解如何調查及移除這項存取權。
二進位檔與非二元條件的比較
系統會呼叫具有兩個可能結果 (例如 true 或 false) 的條件 二進位條件。僅包含二進位條件的決策樹為 稱為「二元決策樹」。
非二元條件出現超過兩種可能的結果。因此 與二元條件相比,非二元條件的判別性更高。 決策中包含一或多個非二元細則,稱為「非二元決策」 樹木。
圖 6:二進位與非二元決策樹。
條件過多 也比較有可能過度配適因此,決策樹系 通常使用二元決策樹,因此本課程將著重於這些結構。
最常見的條件類型是門檻條件,以下列方式表示:
feature ≥ threshold
例如:
num_legs ≥ 2
還有其他類型的條件。以下是其他常見的 二進位條件:
表 2.常見的二進位條件類型。 ,瞭解如何調查及移除這項存取權。
名稱 | 條件 | 範例 |
門檻條件 | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
相等條件 | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``cat"$ |
設定條件 | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{`cat"、``dog"、``bird"\}$ |
斜體條件 | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
缺少地圖項目 | $\mathrm{feature}_i \mathrm{is} \mathrm{缺少}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{缺少}$ |