資料集、一般化和過度配適:考考您的知識

  1. 下列何者是固定資料集的例子?

  2. 您準備訓練模型,使用含有下列功能的資料集來預測二手車的特價:yearmodelmileage。檢查資料集時,您發現在 2,500 個樣本中,有 150 個缺少里程值。下列何者是應採取的合理做法?(可複選)

    請選取所有正確答案。

  3. 您訓練了串流服務的電影推薦模型,以預測使用者是否會喜歡特定電影。下列哪項替代性代理標籤適合用於「使用者喜歡這部電影」?(可複選)

    請選取所有正確答案。

  4. 是非題:訓練模型,直到測試資料中的損失值降至最低為止,這是避免過度配適的好方法。

  5. 請在以下句子中填入句子:
    一般化可在訓練期間懲罰 ___,提升模型將新資料一般化的能力。