このコースで学習した内容を簡単にまとめると、次のようになります。
- ディシジョン ツリーとは、
データセットと
conditions が整理されました
ツリーの形に階層化されます。健康状態にはさまざまな種類があります
カテゴリ:
- 軸に揃えられた 次が含まれます。 特徴が 1 つのみの場合です斜め 次が含まれます。 複数の機能。
- バイナリ condition では、次の 2 つの候補が 向上しますノンバイナリー condition が 2 つの結果が考えられます
- ディシジョン ツリーをトレーニングするには、 計算します。スプリッター ルーティン 次のような指標を使用します。 ゲインまたは Gini を使用して、最も望ましい あります。
- ディシジョン フォレストは、 複数のディシジョン ツリーで構成されるモードです。デシジョン フォレストの予測 ディシジョン ツリーの予測を集約したものです。
- ランダム フォレストは、 複数のディシジョン ツリーを組み合わせ、各ディシジョン ツリーを ノイズを除去できます。
- バッグとは、 ランダム フォレスト内の各ディシジョン ツリーをそれぞれ異なるサブセットでトレーニングする いくつかあります。
- ランダム フォレストには検証データセットは必要ありません。その代わり、最もランダムなものは、 森は、 out-of-bag-evaluation モデルの品質を評価します
- グラデーション ブースト(決定) ツリー 入力からの反復調整によってトレーニングされたデシジョン フォレストの一種 ディシジョン ツリーを使用します。この変数は、 shrinkage は 勾配ブースト(決定)ツリーが学習する時間と、それが 過学習する可能性があります
参照
- 欲張り関数の近似: 勾配ブースト マシン、 J.Friedman。
- 統計の要素 学習、 トレバー ハスティ。第 10 章
- 一般化されたブーストモデル: gbm に関するガイド パッケージ、 GRidgeway