全新改良版機器學習密集課程將於 2024 年 8 月推出。請密切留意相關消息！

本頁面由 Cloud Translation API 翻譯而成。

一般化

「一般化」是指模型與用來建立模型的相同分佈比例，可正確適應之前從未見過的新資料。

一般化

概觀

經期、預測、取樣、探索真實分配、取樣更多

目標：預測 (而非隱藏) 新分佈資料所產生的錯誤。
問題：我們沒有發現真相。

我們只會從該檔案中取樣。

概觀

經期、預測、取樣、探索真實分配、取樣更多

目標：預測 (而非隱藏) 新分佈資料所產生的錯誤。
問題：我們沒有發現真相。

我們只會從該檔案中取樣。

如果 h 模型符合目前的樣本，我該如何相信它能對其他新樣本建立良好預測？

如何得知我們的模型是否合適？

理論上：

有趣欄位：一般理論
以測量模型的簡單 / 複雜度為靈感

直覺：奧克罕的正規化準則

模型的複雜度越高，越能發揮考慮性的結果，這種情況不只是因為我們樣本的特性所致

如何得知我們的模型是否合適？

選擇性：
- 提問：我們的模型是否能對新資料樣本進行良好處置？
- 評估：取得新的資料呼叫範例，稱為測試集
- 測試集表現良好，對新資料一般成效來說十分實用。

機器學習詳細印刷

以上這三項基本假設：

系統從分佈中隨機挑選一個獨立且完全相同 (即 i.i.d.) 的範例
分佈狀態是靜態：不會隨時間變化
我們一律會從相同的發行版本提取資料，包括訓練集、驗證集和測試集

程式設計練習

除非另有註明，否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權，程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。

上次更新時間：2022-09-27 (世界標準時間)。