データセット、一般化、過学習: 知識をテストする

  1. 次のうち、定常的なデータセットの例はどれですか。

  2. あなたは、yearmodelmileage という特徴を含むデータセットを使用して、中古車の販売価格を予測するモデルをトレーニングする準備をしています。データセットを調べると、2,500 個のサンプルのうち 150 個で走行距離の値が欠落していることがわかります。次のうち、妥当な対応はどれですか。(該当するものをすべて選択してください)。

    正しいと思われる解答をすべて選択してください。

  3. ストリーミング サービスの映画レコメンデーション モデルをトレーニングして、ユーザーが特定の映画を楽しむかどうかを予測します。「ユーザーが映画を楽しんだ」ことを表す適切な代替ラベルは、次のうちどれですか。(該当するものをすべて選択してください)

    正しいと思われる解答をすべて選択してください。

  4. 正誤問題: テストデータで損失値が低くなるまでモデルをトレーニングすることは、過学習を防ぐ良い方法です。

  5. 次の文の空欄にあてはまるものは?
    正則化は、トレーニング中に ___ にペナルティをかけることで、新しいデータに対して一般化するモデルの能力を向上させます。