轉換數值資料

您可能需要對數字資料套用兩種轉換類型:

  • 正規化 - 將數字資料轉換為與其他數值資料相同的比例。
  • 特徵分塊 - 將數字 (通常是連續) 資料轉換為類別資料。

為什麼要標準化數值功能?

我們強烈建議您為資料集設定標準化,將數值特徵涵蓋不同的範圍 (例如年齡和收入)。如果不同功能的範圍不同,梯度下降就會導致「跳出」情形,並降低融合速度。AdagradAdam 等最佳化器會為每個功能分別建立有效的學習率,以解決這個問題。

我們也建議將單一數字特徵正規化,涵蓋廣泛的範圍,例如「城市人口」。如果您未正規化「城市人口」功能,訓練模型可能會產生 NaN 錯誤。遺憾的是,如果單一功能中有多個值,Adagrad 和 Adam 等最佳化工具無法防止 NaN 錯誤。