如果您剛開始建立新的機器學習 (ML) 專案,可能會想知道 。手動訓練時,您會使用機器學習架構編寫程式碼,以建立模型。過程中 因此,您可以選擇要探索哪些演算法,並反覆微調 來找出正確模型
當然,您不只需要考慮模型訓練。實際上,從原型到實際生產,建構機器學習模型需要重複的作業和專業技能。簡單的探索性 ML 工作流程如下所示:
重複性工作:機器學習工作流程可能會涉及重複性工作和實驗。舉例來說,在模型開發期間 探索各種不同演算法和超參數的組合 顯示最適當的模型進行手動訓練時 訓練模型並調整程式碼,以不同機器學習方式進行實驗 來找出最佳模型小型或探索性 執行手動程序的專案可能並非問題, 對於規模較大的專案而言 重複性工作可能相當耗時
專門技能:手動開發機器學習模型需要專門技能。實際上,並非每個打算開發機器學習模型的團隊都具備這些技能。如果團隊沒有專門的數據資料學家, 這種手動作業可能無法可行
幸好,模型開發的某些步驟可以自動執行 重複性工作及對專業技能的需求本單元將介紹自動化機器學習 (AutoML) 的相關主題,並說明如何自動執行這些工作。
什麼是 AutoML?
AutoML 是將模型 某些工作 您可以將 AutoML 視為一組工具和技術,可加快機器學習模型的建構速度,並讓更多使用者存取這些模型。雖然自動化功能可協助處理整個機器學習工作流程,但與 AutoML 相關的任務通常是指圖 1 所示的模型開發週期。這些重複性工作包括:
- 資料工程
- 特徵工程。
- 特徵選取。
- 訓練
- 找出合適的機器學習演算法。
- 選擇最佳超參數。
- 分析
- 評估訓練期間產生的指標 驗證資料集
有了 AutoML,您就能專心處理機器學習問題和資料 包括選擇、調整超參數及選用合適的演算法