コースのまとめ

このコースで学習した内容を簡単にまとめると、次のようになります。

  • ディシジョン ツリーとは、 データセットと conditions が整理されました ツリーの形に階層化されます。健康状態にはさまざまな種類があります カテゴリ:
  • ディシジョン ツリーをトレーニングするには、 計算します。スプリッター ルーティン 次のような指標を使用します。 ゲインまたは Gini を使用して、最も望ましい あります。
  • ディシジョン フォレストは、 複数のディシジョン ツリーで構成されるモードです。デシジョン フォレストの予測 ディシジョン ツリーの予測を集約したものです。
  • ランダム フォレストは、 複数のディシジョン ツリーを組み合わせ、各ディシジョン ツリーを ノイズを除去できます。
  • バッグとは、 ランダム フォレスト内の各ディシジョン ツリーをそれぞれ異なるサブセットでトレーニングする いくつかあります。
  • ランダム フォレストには検証データセットは必要ありません。その代わり、最もランダムなものは、 森は、 out-of-bag-evaluation モデルの品質を評価します
  • グラデーション ブースト(決定) ツリー 入力からの反復調整によってトレーニングされたデシジョン フォレストの一種 ディシジョン ツリーを使用します。この変数は、 shrinkage は 勾配ブースト(決定)ツリーが学習する時間と、それが 過学習する可能性があります

 

参照