このページでは、「トレーニングのディシジョン ツリー」の教材で説明されている一連の問題に解答します。
問題 1
数値特徴を負の値に置き換える(たとえば、値 +8 を -8 に変更する)と、正確な数値スプリッターを基準にどのような影響がありますか?
同じ条件が学習されます。ポジティブ/ネガティブな子のみが切り替えられます。
いや、素晴らしい。
さまざまな条件が学習されますが、ディシジョン ツリーの全体的な構造は同じです。
対象物が変化すると条件も変化します。
ディシジョン ツリーの構造はまったく異なります。
ディシジョン ツリーの構造は、実際にはほぼ同じです。ただし、条件は変わります。
問題 2
X の候補のしきい値の半分(ランダムに選択された)だけをテストした場合の効果を最もよく表している回答を、次の中から 2 つ選んでください。
情報ゲインはそれ以上となります。
情報ゲインはそれ以下になります。
よくできました。
最終的なディシジョン ツリーではテストの精度が落ちます。
最終的なディシジョン ツリーではトレーニングの精度が向上します。
よくできました。
Question 3
「情報ゲイン」と「しきい値」曲線のどちらがローカル最大値にある場合、どうなるでしょうか。
ローカルの最大値を複数指定することはできません。
ローカルの最大値は複数指定できます。
アルゴリズムは、最小のしきい値を持つローカル最大値を選択します。
アルゴリズムによってグローバル最大値が選択されます。
よくできました。
Question 4
次の分割の情報ゲインを計算します。
ノード | ポジティブ サンプルの数 | ネガティブ サンプルの数 |
---|---|---|
親ノード | 10 | 6 |
最初のお子様 | 8 | 2 |
2 人目の子供 | 2 | 4 |