ディシジョン ツリー

デシジョン フォレスト モデルはディシジョン ツリーで構成されます。デシジョン フォレスト 学習アルゴリズム(ランダム フォレストなど)は、少なくとも部分的に 学習します。

本コースのこのセクションでは、小規模なデータセットの例と、 トレーニングする方法です。以降のセクションでは、 デシジョン ツリーを組み合わせてデシジョン フォレストをトレーニングします。

YDF コード

YDF で、CART 学習者を使用して個々のディシジョン ツリー モデルをトレーニングします。

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

モデル

ディシジョン ツリーは「質問」のコレクションで構成されるモデル整理 ツリーの形に階層化されます。問題は通常、 条件分割テストのいずれかです。ここでは「状態」という用語を使用します。 使用します。各非リーフノードには条件が含まれ、各リーフノードには できます。

植物の木は通常、根が一番下になるように成長します。しかし 意思決定は ツリーは通常、最上位のルート(最初のノード)で表されます。

2 つの条件と 3 つのリーフを含むディシジョン ツリー。最初の
条件(ルート)が num_legs >= 3; である2 つ目の条件は
目の数は 3 以上です。3 枚の葉はペンギン、クモ、
作成します。

<ph type="x-smartling-placeholder"></ph> 図 1.単純な分類ディシジョン ツリー。緑色の凡例は、 決定します で確認できます。

 

ディシジョン ツリー モデルの推論は、 に従って、いずれかのリーフノード(最下部)に あります。到達したリーフの値はディシジョン ツリーの予測です。 訪問されるノードの集合は推論パスと呼ばれます。たとえば 次の特徴値について考えてみましょう。

num_legs num_eyes
4 2

予測は「」になります。推論パスは次のようになります。

  1. num_legs ≥ 3 → あり
  2. num_eyes ≥ 3 → いいえ

図は図 1 と同じものですが、
  犬のリーフで終わる 2 つの条件にわたる推論パス。

<ph type="x-smartling-placeholder"></ph> 図 2.この例で、犬の葉の「犬」となる推論パス *{num_legs : 4, num_eyes : 2}*. で確認できます。

 

前の例では、ディシジョン ツリーのリーフに つまり、各葉に 1 つのセットに含まれる動物種が含まれる 考えられます

同様に、ディシジョン ツリーでも、葉に次のラベルを付けて数値を予測できます。 回帰予測(数値)。たとえば、次のように決定します。 tree は、動物のキュートネス スコアを 0 ~ 10 の数値で予測します。

各リーフに異なる浮動小数点数が含まれるディシジョン ツリー
  あります。

<ph type="x-smartling-placeholder"></ph> 図 3:数値予測を行うディシジョン ツリー。 で確認できます。