處理數值資料

機器學習從業人員投入更多時間評估、清理及轉型 而非建構模型 資料非常重要,這堂課程特別針對這個主題列出三個整個單元:

本單元著重介紹 數值資料, 代表整數或浮點值 以數字表示換言之,資料表是累加、可計數、排序 依此類推下一個單元 類別型資料,以便 包括運作方式與類別相仿的數字第三個單元將重點放在 做好資料準備,在訓練及評估時確保資料品質 模型

數值資料的範例包括:

  • 溫度
  • 重量
  • 自然保護區的鹿冬天數量

相對地,儘管美國 這 5 位數或 9 位數的數字,不是數字或代表數字 數學關係郵遞區號 40004 (肯塔基州尼爾森郡) 為 而不是兩倍的郵遞區號 20002 (華盛頓特區)。這些號碼 用來代表類別,尤其是地理區域 分類型資料