全新改良版機器學習密集課程將於 2024 年 8 月推出。請密切留意相關消息!
訓練集和測試集
我們回到 Playground 進行訓練集和測試集
按一下加號圖示,取得橘色和藍點代表的意義。
在視覺化圖表中:
- 每個藍點都代表某一類別的資料範例 (例如垃圾內容)。
- 每個橘色圓點都代表其他類別的資料範例 (例如非垃圾內容)。
- 背景顏色代表模型生成該顏色範例的預測結果。藍點周圍的藍色背景表示模型正確預測該範例。相反地,藍點周圍出現橘色背景,就代表模型對該範例的預測不正確。
這項練習會提供測試集和訓練集,兩者均擷取自同一個資料集。根據預設,視覺呈現只會顯示訓練集。如果您也想查看測試集,請按一下視覺呈現正下方的「顯示測試資料」核取方塊。在視覺呈現中,請注意下列差異:
工作 1:執行下列操作,以指定的設定執行 Playground:
- 按一下「Run/Pause」按鈕:
![](https://developers.google.cn/static/machine-learning/crash-course/images/DeepPlaygroundPlayButton.png?authuser=2&hl=zh-tw)
- 觀察測試損失和訓練損失值的變化。
- 當測試損失和訓練損失值停止變更,或每隔一段時間才變更一次,請再次按下「執行/暫停」按鈕,暫停「Playground」。
請注意測試損失與訓練損失之間的差異。我們會在下列工作中嘗試減少差異。
工作 2:執行下列操作:
- 按下重設按鈕。
![](https://developers.google.cn/static/machine-learning/crash-course/images/DeepPlaygroundResetButton.png?authuser=2&hl=zh-tw)
- 修改學習率。
- 按下「執行/暫停」按鈕:
![](https://developers.google.cn/static/machine-learning/crash-course/images/DeepPlaygroundPlayButton.png?authuser=2&hl=zh-tw)
- 讓 Playground 執行至少 150 個週期。
採用新的學習率後,測試損失與訓練損失差距降幅?如果同時修改學習率和批次大小,會發生什麼事?
選用工作 3:標示為「訓練資料百分比」的滑桿可讓您控制訓練資料要測試資料所佔的比例。例如,設為 90% 時,系統會將 90% 的資料用於訓練集,其餘的 10% 則用於測試集。
請完成下列步驟:
- 將「訓練資料百分比」從 50% 降至 10%。
- 嘗試利用學習率和批次大小進行實驗,記下您的發現。
如果變更訓練資料百分比,您在工作 2 中發現的最佳學習設定是否會影響?如果是,請說明原因。
按一下加號圖示,找出工作 1 的答案。
如果學習率設為 3 (初始設定),則測試損失大幅高於訓練損失。
按一下加號圖示,找出工作 2 的答案。
透過降低學習率 (例如 0.001) 之後,測試損失會降低至更接近訓練損失的值。在大多數執行作業中,增加批次大小不會影響訓練損失或測試損失。但是,在少數執行作業中,將批次大小增加為 20 以上,會導致測試損失稍微下降至訓練損失。
Playground 的資料集是隨機產生。因此,我們的答案不一定與您的答案完全相同。
按一下加號圖示,找出工作 3 的答案。
將訓練資料百分比從 50% 降至 10% 可大幅降低訓練集的資料點數量。當資料很少時,批次大小和學習率較高會導致訓練模型自動跳動 (重複於最小點)。