使用數值資料:測試您的知識

  1. 下列哪些技術不是特徵工程?

  2. 您正在使用嬰兒健康資料訓練模型。其中一項功能是「birth_weight」。您想要將這些 birth_weight 值正規化,以便提升模型的訓練效率。下列何者是最合適的正規化技術?

  3. 是非題:特徵分塊是將類別型資料轉換為數值資料的技術。

  4. 鞋類推薦模型的訓練資料含有 shoe_size 功能,該特徵應包含介於 6 至 16 的值。下表顯示資料集中六個範例的 shoe_size 值:

    範例 shoe_size
    1 8.5
    2 9
    3 不適用
    4 105
    5 11
    6 9

    訓練前,您應考慮清除資料集中的哪些例子? (可複選)

    請選取所有正確答案。

  5. 請在下列句子中填入句子:
    在特徵工程期間,可建立合成特徵至 ___。