訓練和測試集：遊樂場練習

訓練集和測試集

我們回到 Playground 進行訓練集和測試集

在視覺化圖表中：

這項練習會提供測試集和訓練集，兩者均擷取自同一個資料集。根據預設，視覺呈現只會顯示訓練集。如果您也想查看測試集，請按一下視覺呈現正下方的「顯示測試資料」核取方塊。在視覺呈現中，請注意下列差異：

工作 1：執行下列操作，以指定的設定執行 Playground：

請注意測試損失與訓練損失之間的差異。我們會在下列工作中嘗試減少差異。

工作 2：執行下列操作：

採用新的學習率後，測試損失與訓練損失差距降幅？如果同時修改學習率和批次大小，會發生什麼事？

選用工作 3：標示為「訓練資料百分比」的滑桿可讓您控制訓練資料要測試資料所佔的比例。例如，設為 90% 時，系統會將 90% 的資料用於訓練集，其餘的 10% 則用於測試集。

請完成下列步驟：

如果變更訓練資料百分比，您在工作 2 中發現的最佳學習設定是否會影響？如果是，請說明原因。

如果學習率設為 3 (初始設定)，則測試損失大幅高於訓練損失。

透過降低學習率 (例如 0.001) 之後，測試損失會降低至更接近訓練損失的值。在大多數執行作業中，增加批次大小不會影響訓練損失或測試損失。但是，在少數執行作業中，將批次大小增加為 20 以上，會導致測試損失稍微下降至訓練損失。

Playground 的資料集是隨機產生。因此，我們的答案不一定與您的答案完全相同。

將訓練資料百分比從 50% 降至 10% 可大幅降低訓練集的資料點數量。當資料很少時，批次大小和學習率較高會導致訓練模型自動跳動 (重複於最小點)。