條件的類型

本單元著重介紹用於建構決策的各種條件 樹木

軸對齊與斜體條件

軸對齊 條件只包含一個特徵。一個斜角 條件包含多個特徵舉例來說, 軸對齊條件:

num_legs ≥ 2

雖然下列情況為斜式:

num_legs ≥ num_fingers

決策樹通常只用軸對齊條件進行訓練。不過 斜角分割法更為強大,因為能呈現更複雜的 例如模式跳躍式分裂有時會產生更好的結果 訓練與推論成本較高

YDF 代碼
在 YDF 中,系統預設會以軸對齊條件訓練決策樹。 您可以透過 split_axis="SPARSE_OBLIQUE" 參數。

軸對齊條件為「num_legs >= 3」。斜角條件為
  "num_legs + 重量 * 5 >= 12"。

圖 4.以軸對齊的條件和斜角條件範例。 ,瞭解如何調查及移除這項存取權。

 

以圖形呈現上述兩個條件會產生以下特徵空間 區隔:

體重與數字的比較圖表。軸對齊條件
  忽略權重,因此只是垂直線。花椰菜
  條件顯示了負坡度線。

圖 5.圖 4 中條件的特徵空間分隔。 ,瞭解如何調查及移除這項存取權。

 

二進位檔與非二元條件的比較

系統會呼叫具有兩個可能結果 (例如 true 或 false) 的條件 二進位條件。僅包含二進位條件的決策樹為 稱為「二元決策樹」

非二元條件出現超過兩種可能的結果。因此 與二元條件相比,非二元條件的判別性更高。 決策中包含一或多個非二元細則,稱為「非二元決策」 樹木

二元與非二元決策樹的比較。二元決策
  樹狀結構包含兩個二進位條件;非二元決策樹
  包含一個非二元條件。

圖 6:二進位與非二元決策樹。

 

條件過多 也比較有可能過度配適因此,決策樹系 通常使用二元決策樹,因此本課程將著重於這些結構。

最常見的條件類型是門檻條件,以下列方式表示:

featurethreshold

例如:

num_legs ≥ 2

還有其他類型的條件。以下是其他常見的 二進位條件:

 

表 2.常見的二進位條件類型。 ,瞭解如何調查及移除這項存取權。

名稱 條件 範例
門檻條件 $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
相等條件 $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
設定條件 $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{`cat"、``dog"、``bird"\}$
斜體條件 $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
缺少地圖項目 $\mathrm{feature}_i \mathrm{is} \mathrm{缺少}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{缺少}$