如果您剛開始建立新的機器學習 (ML) 專案,可能會想知道 。取代為 手動訓練,您也能透過機器學習架構編寫程式碼來建立模型。過程中 因此,您可以選擇要探索哪些演算法,並反覆微調 來找出正確模型
當然,模型訓練並非唯一需要考慮的事項。於 實際練習建構機器學習模型 從原型到實際推出等各階段 包括重複性工作和專業技能簡單的探索機器學習 整個工作流程大致如下:
重複工作:機器學習工作流程可能涉及重複性工作 進行實驗。舉例來說,在模型開發期間 探索各種不同演算法和超參數的組合 顯示最適當的模型進行手動訓練時 訓練模型並調整程式碼,以不同機器學習方式進行實驗 來找出最佳模型小型或探索性 執行手動程序的專案可能並非問題, 對於規模較大的專案而言 重複性工作可能相當耗時
專業技能:手動開發機器學習模型需要專業領域 技術。實際上,並非所有團隊都打算開發機器學習模型 可能具備這些技能如果團隊沒有專門的數據資料學家, 這種手動作業可能無法可行
幸好,模型開發的某些步驟可以自動執行 重複性工作及對專業技能的需求自動化處理這些項目 是這個單元介紹自動化機器學習 (AutoML) 的主體。
什麼是 AutoML?
AutoML 是將模型 某些工作 您可以將 AutoML 視為一組用來建構的工具和技術 更快速、更容易使用機器學習模型, 雖然自動化可在整個機器學習工作流程中提供協助,不過頻繁執行的工作 AutoML 的相關數據會包含在模型開發週期中 如圖 1 所示。重複性工作包括:
- 資料工程
- 特徵工程
- 選取特徵。
- 訓練
- 找出合適的機器學習演算法。
- 選擇最合適的超參數。
- 分析
- 評估訓練期間產生的指標 驗證資料集
有了 AutoML,您就能專心處理機器學習問題和資料 包括選擇、調整超參數及選用合適的演算法