學習目標
本單元的學習內容包括:
- 調查原始或已處理資料集的潛在問題,包括: 收集及處理品質問題
- 找出偏誤、無效推論和合理化。
- 找出資料分析的常見問題,包括關聯性、 找出相關資訊,以及關聯性和關聯性
- 檢視圖表,檢視常見問題、誤解與 誤導性的顯示與設計選項
機器學習動機
雖然不像模型架構和其他下游模型一樣精美 資料探索、說明文件及預先處理,都是企業成功的關鍵 機器學習的運作方式機器學習從業人員可以像 Nithya Sambasivan 等人打給 資料串 的2021 年 ACM 報告 如果客戶不深入瞭解:
- 收集資料的條件
- 資料的品質、特性和限制
- 哪些資料可以和不能顯示
以錯誤的資料訓練模型,成本非常高 只有在輸出內容品質偏低時才會發現 與資料互動同樣地,如果無法掌握資料限制 收集資料有偏誤,或是為原因產生誤解 可能會導致廣告過度放送或放送不足的情況, 導致失去信任
本課程將介紹機器學習和資料常見但常見的細微資料陷阱 專業執業人員可能會在工作中遭遇任何風險。