本頁面由 Cloud Translation API 翻譯而成。

簡單化 - Lambda

模型開發人員可將值乘以「lambda」 (也稱為「正規化率」) 中的價值，藉此調整正規化字詞的整體影響。也就是說，模型開發人員的目標是：

$$\text{minimize(Loss(Data|Model)} + \lambda \text{ complexity(Model))}$$

執行 L₂ 正規化會對模型產生下列影響

增加 lambda 值可強化正規化效果。舉例來說，高價值 lambda 的權重直方圖可能如圖 2 所示。

圖 2. 權重直方圖。

降低 lambda 的值通常會產生平面直方圖，如圖 3 所示。

圖 3. 較低的 lambda 值產生的權重直方圖。

選擇 lambda 值時，目標是在簡易性與訓練資料相符程度之間取得平衡：

lambda 的理想值會產生一個模型，可以廣泛依據先前未顯示的新資料。可惜的是，lambda 的理想值取決於資料，因此您需要手動或自動進行調整。

學習率和 lambda 之間有相當近的關聯。強烈的 L₂ 正則化值通常會使特徵權重趨於近 0。較低的學習率 (採用提早中止訓練) 也能產生相同的影響，因為步驟 0 的步驟不大。因此，同時調整學習率和 lambda 可能會令人感到困惑。

「提早中止訓練」是指在模型完全達到收斂效果之前結束訓練。實際上，在以線上 (連續) 的方式訓練時，我們通常會做一些隱性的提早中止訓練。也就是說，一些新趨勢還沒有足夠的資料可以收斂

如前所述，從變更到正規化參數所帶來的影響，可以與學習率或疊代次數變動所造成的影響保持一致。一項實用的做法 (針對固定的一批資料進行訓練) 是為自己提供足夠的疊代，避免在提前停止的過程中發揮某些作用。