デシジョン フォレスト モデルはディシジョン ツリーで構成されます。デシジョン フォレスト 学習アルゴリズム(ランダム フォレストなど)は、少なくとも部分的に 学習します。
本コースのこのセクションでは、小規模なデータセットの例と、 トレーニングする方法です。以降のセクションでは、 デシジョン ツリーを組み合わせてデシジョン フォレストをトレーニングします。
YDF で、CART 学習者を使用して個々のディシジョン ツリー モデルをトレーニングします。
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
モデル
ディシジョン ツリーは「質問」のコレクションで構成されるモデル整理 ツリーの形に階層化されます。問題は通常、 条件、分割、テストのいずれかです。ここでは「状態」という用語を使用します。 使用します。各非リーフノードには条件が含まれ、各リーフノードには できます。
植物の木は通常、根が一番下になるように成長します。しかし 意思決定は ツリーは通常、最上位のルート(最初のノード)で表されます。
<ph type="x-smartling-placeholder"></ph> 図 1.単純な分類ディシジョン ツリー。緑色の凡例は、 決定します で確認できます。
ディシジョン ツリー モデルの推論は、 に従って、いずれかのリーフノード(最下部)に あります。到達したリーフの値はディシジョン ツリーの予測です。 訪問されるノードの集合は推論パスと呼ばれます。たとえば 次の特徴値について考えてみましょう。
num_legs | num_eyes |
---|---|
4 | 2 |
予測は「犬」になります。推論パスは次のようになります。
- num_legs ≥ 3 → あり
- num_eyes ≥ 3 → いいえ
<ph type="x-smartling-placeholder"></ph> 図 2.この例で、犬の葉の「犬」となる推論パス *{num_legs : 4, num_eyes : 2}*. で確認できます。
前の例では、ディシジョン ツリーのリーフに つまり、各葉に 1 つのセットに含まれる動物種が含まれる 考えられます
同様に、ディシジョン ツリーでも、葉に次のラベルを付けて数値を予測できます。 回帰予測(数値)。たとえば、次のように決定します。 tree は、動物のキュートネス スコアを 0 ~ 10 の数値で予測します。
<ph type="x-smartling-placeholder"></ph> 図 3:数値予測を行うディシジョン ツリー。 で確認できます。