在庫切れ評価
ランダム フォレストには検証データセットは必要ありません。ほとんどのランダム フォレストでは、モデルの品質を評価するためにアウトオブバッグ評価(OOB 評価)という手法が使用されます。out-of-bag-evaluationout-of-bag-evaluationout-of-bag-evaluationOOB 評価では、トレーニング セットは交差検証のテストセット上にあるものとして扱われます。
前述のように、ランダム フォレスト内の各ディシジョン ツリーは通常、約 67% のトレーニング サンプルでトレーニングされます。したがって 各ディシジョンツリーにはトレーニングサンプルの 33% 程度しか含まれませんOOB 評価の中核となる考え方は次のとおりです。
- トレーニング セットでランダム フォレストを評価する。
- それぞれの例で、トレーニング中に例を見なかったディシジョン ツリーのみを使用します。
次の表は、6 つのサンプルでトレーニングされた 3 つのディシジョン ツリーがあるランダム フォレストの OOB 評価を示しています。(「バギング」セクションと同じテーブルです)。この表は、OOB 評価でどのディシジョンツリーをどの例で使用するかを示しています。
表 7. OOB 評価 - 数値は、特定のサンプルのトレーニング中に特定のトレーニング サンプルが使用された回数を表します
トレーニング サンプル | OOB 評価の例 | ||||||
---|---|---|---|---|---|---|---|
#1 | #2 | #3 | #4 | #5 | 6 位 | ||
元のデータセット | 1 | 1 | 1 | 1 | 1 | 1 | |
ディシジョン ツリー 1 | 1 | 1 | 0 | 2 | 1 | 1 | #3 |
ディシジョン ツリー 2 | 3 | 0 | 1 | 0 | 2 | 0 | #2、#4、#6 |
ディシジョン ツリー 3 | 0 | 1 | 3 | 1 | 0 | 1 | 1 と 5 |
表 7 の例では、トレーニング例 1 の OOB 予測は、ディシジョン ツリー #3 を使用して計算されます(ディシジョン ツリー #1 と #2 がこの例をトレーニングに使用したため)。実際には、妥当なサイズのデータセットと少数のディシジョン ツリーを使用するすべての例に OOB 予測があります。
compute_oob_performances=True
でトレーニングされている場合、トレーニング ログで OOB 評価を使用できます。OOB 評価は、ランダム フォレスト モデルの順列の変数の重要度を計算する際にも効果的です。変数の重要度を思い出してください。並べ替え変数の重要度は、変数がシャッフルされたときにモデルの品質の低下を測定することで、変数の重要度を測定します。ランダム フォレストの「OOB 置換変数の重要度」は、OOB 評価を使用して計算された置換変数の重要度です。
compute_oob_variable_importances=True
でトレーニングされている場合、OOB 順列の変数の重要度をトレーニング ログで確認できます。