本頁面由 Cloud Translation API 翻譯而成。

什麼是機器學習？

機器學習 (ML) 是我們所用部分重要技術的幕後功臣，從翻譯應用程式到自駕車，都採用這項技術。本課程說明機器學習背後的基礎概念。

機器學習提供解決問題、回答複雜問題及建立新內容的新方法。機器學習可以預測天氣、估算行程時間、推薦歌曲、自動完成句子、摘要文章，以及生成前所未見的圖片。

簡單來說，機器學習是訓練軟體 (稱為模型) 的過程，目的是根據資料做出實用的預測或生成內容 (例如文字、圖片、音訊或影片)。

舉例來說，假設我們想建立應用程式來預測降雨量，我們可以採用傳統方法或機器學習方法。如果採用傳統做法，我們會建立地球大氣和地表的物理表示法，並計算大量流體動力學方程式。這項作業非常困難。

我們採用機器學習方法，提供大量天氣資料給機器學習模型，直到模型最終學會產生不同雨量的天氣模式之間的數學關係。接著，我們會將目前的天氣資料提供給模型，模型就會預測降雨量。

隨堂測驗

在機器學習中，「模型」是指什麼？

模型是從資料衍生的數學關係，機器學習系統會使用模型進行預測

型號是指電腦硬體

模型是您研究對象的縮小版。

機器學習系統類型

機器學習系統會根據學習預測或生成內容的方式，歸入下列一或多個類別：

監督式學習
非監督式學習
強化學習
生成式 AI

監督式學習

監督式學習模型在看過大量附有正確答案的資料後，就能進行預測，並找出資料中元素之間的關聯，進而產生正確答案。這就像學生透過研讀包含問題和答案的舊考卷，學習新教材。學生練習過足夠的舊試題後，就能充分準備好參加新考試。這些機器學習系統會「受到監督」，因為人類會提供已知正確結果的資料給機器學習系統。

監督式學習最常見的兩種用途是迴歸和分類。

迴歸

迴歸模型可預測數值。舉例來說，預測降雨量 (以英吋或公釐為單位) 的天氣模型就是迴歸模型。

下表列出更多迴歸模型範例：

情境	可能的輸入資料	數值預測
未來房價	坪數、郵遞區號、臥室和浴室數量、地塊大小、抵押貸款利率、房地產稅率、建造成本，以及該地區待售房屋數量。	房屋價格。
未來的行程時間	歷史交通狀況 (從智慧型手機、交通感應器、叫車和其他導航應用程式收集)、與目的地的距離和天氣狀況。	抵達目的地的時間 (以分鐘和秒為單位)。

分類

分類模型會預測某個項目屬於某個類別的可能性。迴歸模型會輸出數字，而分類模型則會輸出值，指出某個項目是否屬於特定類別。舉例來說，分類模型可用來預測電子郵件是否為垃圾郵件，或相片是否含有貓。

分類模型分為兩類：二元分類和多類別分類。二元分類模型會從只包含兩個值的類別輸出值，例如輸出 rain 或 no rain 的模型。多重類別分類模型會從包含兩個以上值的類別輸出值，例如可輸出 rain、hail、snow 或 sleet 的模型。

隨堂測驗

如要使用機器學習模型預測商業建築的能源用量，應使用哪種模型？

迴歸

能源用量是以千瓦時 (kWh) 為單位，屬於數值，因此您會想使用迴歸模型。

分類

分類模型會預測某個項目是否屬於某個類別，而迴歸模型則會預測數字。由於能源用量是以千瓦時 (kWh) 為單位，因此您會想使用迴歸模型。

非監督式學習

非監督式學習模型會根據不含任何正確答案的資料進行預測。非監督式學習模型的目標是找出資料中的有意義模式。換句話說，模型不會獲得任何有關如何分類每項資料的提示，而是必須自行推論出規則。

常用的非監督式學習模型會採用稱為「叢集」的技術。模型會找出劃分自然分組的資料點。

圖 1. 機器學習模型會將類似的資料點分群。

圖 2. 以自然分界劃分的叢集群組。

叢集與分類不同，因為類別並非由您定義。舉例來說，非監督式模型可能會根據溫度將天氣資料集分群，揭露定義季節的區隔。然後根據您對資料集的瞭解，嘗試為這些叢集命名。

圖 3. 機器學習模型會將類似的天氣模式歸類。

圖片：顯示以不同顏色標示的點狀叢集，分別代表下雪、下雨、下冰雹和無雨，這些點狀叢集以形狀標示，彼此相鄰。

圖 4. 標示為下雪、雨夾雪、下雨和無雨的天氣模式叢集。

隨堂測驗

監督式做法與非監督式做法有何不同？

監督式方法會提供含有正確答案的資料。

監督式方法會提供含有正確答案的資料。模型的工作是找出資料中的關聯，產生正確答案。非監督式方法會提供沒有正確答案的資料，這項工作的目標是找出資料中的分組。

監督式做法通常會使用叢集。

非監督式方法會使用分群。

非監督式方法會為資料叢集加上標籤。

非監督式方法無法瞭解資料叢集的意義。您可以根據對資料的瞭解自行定義這些項目。

強化學習

增強學習模型會根據環境中執行的動作，獲得獎勵或懲罰，藉此進行預測。增強學習系統會產生政策，定義獲得最多獎勵的最佳策略。

強化學習可用於訓練機器人執行任務，例如在房間內走動，以及訓練軟體程式 (例如 AlphaGo) 下圍棋。

生成式 AI

生成式 AI 是一類模型，可根據使用者輸入內容生成內容。例如，生成獨特的圖片、音樂和笑話；摘要文章、說明如何執行工作，或編輯相片。

生成式 AI 可接受各種輸入內容，並生成文字、圖片、音訊和影片等各種輸出內容。也可以擷取這些內容並建立組合。舉例來說，模型可以將圖片做為輸入內容，並生成圖片和文字做為輸出內容；也可以將圖片和文字做為輸入內容，並生成影片做為輸出內容。

我們可以根據生成模型的輸入和輸出內容來討論，通常會寫成「輸入類型」-「輸出類型」。舉例來說，以下是生成模型的部分輸入和輸出內容清單：

文字轉文字
文字轉圖片
文字轉影片
文字轉程式碼
文字轉語音
圖像和文字轉圖像

下表列出生成模型、輸入內容和可能的輸出內容範例：

模型	輸入	輸出範例
文字轉文字	勒芒賽事是誰發明的？	勒芒 24 小時耐力賽由 Automobile Club de l'Ouest (ACO) 創立，這個汽車組織成立於 1906 年。第一場賽事於 1923 年 5 月 26 日和 27 日在薩爾特賽道舉行，這條 13.426 公里 (8.345 英里) 的公路賽道位於法國勒芒鎮附近。這項賽事最初的構想是為了宣傳 ACO 和薩爾特地區。來源：Bard
文字轉圖片	外星章魚一邊看報紙，一邊穿過入口。	來源：Imagen
文字轉影片	一隻逼真的泰迪熊在舊金山的海中游泳。泰迪熊潛入水中。泰迪熊繼續在水下與色彩繽紛的魚群一起游泳。一隻熊貓在水下游泳。	來源：Phenaki
文字轉程式碼	編寫 Python 迴圈，疊代數字清單並列印質數。	for number in numbers: # Check if the number is prime. is_prime = True for i in range(2, number): if number % i == 0: is_prime = False break # If the number is prime, print it. if is_prime: print(number) 來源：Bard
圖片轉文字		這是火鶴。這些島嶼位於加勒比海。資料來源： Google DeepMind