什麼是機器學習?

機器學習 (ML) 是 Google 的重要技術基礎,例如翻譯應用程式和自動駕駛車輛。本課程將說明機器學習的核心概念

機器學習提供新方法來解決問題、回答複雜問題,以及建立新內容。機器學習可以預測天氣、預估交通時間、推薦歌曲、自動完成句子、提供文章摘要,並產生前所未見的圖片。

基本上,機器學習是指「訓練」軟體 (稱為「模型」model) 的程序,以便執行實用的預測結果或從資料產生內容。

舉例來說,假設我們想建構可預測降雨量的應用程式,我們可以採用傳統方法或機器學習方法我們透過傳統做法,以物理學的方式呈現地球大氣層和表面,計算大量流體動態方程式。這很困難

採用機器學習技術,我們會為機器學習模型提供大量的天氣資料,直到機器學習模型最終學習出產生不同雨量的天氣模式之間的數學關係為止。接著,我們會提供目前的天氣資料模型,並預測降雨量。

隨堂測驗

什麼是機器學習中的「模型」?
模型是機器學習系統用來進行預測的資料衍生的數學關係
模型是一部電腦硬體
模型只代表你的研究主題。

機器學習系統類型

根據機器學習系統如何進行預測或產生內容,您可以分為下列一或多個類別:

  • 監督式學習
  • 非監督式學習
  • 強化學習
  • 生成式 AI

監督式學習

監督式學習模型可在查看大量資料並提供正確答案後進行預測,然後找出產生正確答案的資料元素之間的關聯。這就像是研究舊制考試 找出包含問答集時的新學科學生完成且通過一定時間的測驗後,就可以準備參加新測驗。這類機器學習系統是「監督式」,因為人類提供機器學習系統資料,且具有已知的正確結果。

監督式學習最常見的兩個用途是迴歸和分類。

迴歸

「迴歸模型」會預測數字值。舉例來說,預測降雨量 (以英寸或公釐為單位) 的天氣模型就是一種迴歸模型。

如需更多迴歸模型範例,請參閱下表:

情境 可能的輸入資料 數值預測
未來房屋價格 正方形影片片段、郵遞區號、臥室數量、浴室數量、場地尺寸、貸款利率、房源稅率、建築費用,以及該區域待售房屋數量。 住家價格。
未來乘車時間 歷來路況 (資料來源為智慧型手機、交通感應器、叫車服務和其他導航應用程式)、與目的地的距離,以及天氣狀況。 抵達目的地所需的時間 (以分鐘和秒為單位)。

分類

「分類模型」可預測特定內容屬於特定類別的可能性。與迴歸模型不同,迴歸模型的輸出內容為數字,而分類模型會輸出一個值,指出某個項目是否屬於特定類別。舉例來說,分類模型可用來預測電子郵件是否為垃圾內容,或是相片是否包含貓。

分類模型分成兩組:二元分類和多元分類。二元分類模型會從只包含兩個值的類別輸出值,例如輸出 rainno rain 的模型。多類別分類模型會從包含超過兩個值的類別輸出值,例如可以輸出 rainhailsnowsleet 的模型。

隨堂測驗

如要使用機器學習模型來預測商業建築物的能源用量,請問你會使用哪種模型?
迴歸
能源用量是以千瓦時 (kWh) 為單位計算。這個值為數字,因此建議使用迴歸模型。
分類
分類模型會預測特定項目是否屬於某個類別,而迴歸模型則會預測數值。由於能源用量是以千瓦時 (kWh) 為單位計算 (單位為千瓦時),因此建議您使用迴歸模型。

非監督式學習

非監督式學習模型會獲得不含任何正確答案的資料來進行預測。非監督式學習模型的目標是找出資料中的有意義的模式。換句話說,模型沒有有關如何分類每個資料的提示,但必須推論其自己的規則。

常用的非監督式學習模型採用稱為分群的技術。模型會尋找資料點 區分自然分組

顯示叢集內彩色圓點的圖片。

圖 1:將類似資料點分群的機器學習模型。

這張圖片顯示叢集中有不同顏色的點,由形狀圍繞的形狀和邊框組成。

圖 2:有自然分裂的叢集群組。

叢集和分類不同,因為您並未定義類別。例如,非監督模型可能會根據溫度將天氣資料集分群,並顯示定義季節的區隔。接著,您可以嘗試根據對資料集的瞭解來命名這些叢集。

這張圖片顯示叢集中有不同顏色的點,分別標示為「雪」、「雨」、「冰雹」和「沒有雨」。

圖 3:可將類似天氣模式分群的機器學習模型。

這張圖片顯示叢集中不同顏色的點,這些標籤分別以「雪」、「雨」、「冰雹」和「無雨」的外形和邊框形成。

圖 4 標示為雪、雨、下雨和無雨的天氣模式叢集。

隨堂測驗

監督式方法與非監督式方法有何差別?
監督式方法是提供含有正確答案的資料。
監督式方法是提供含有正確答案的資料。模型的作用是在資料中找出產生正確答案的連結。非監督式方法指的是資料沒有正確答案。作用是找出資料中的分組。
監督式方法通常使用分群法。
非監督式方法會使用分群法。
非監督式方法知道如何為資料叢集加上標籤。
非監督式方法並不知道資料叢集的意義。您可以根據對資料的理解,自行定義資料。

強化學習

強化學習模型會根據在環境內執行的動作取得獎勵或懲罰,藉此進行預測。強化學習系統會產生政策,定義可以獲取最多獎勵的最佳策略。

強化學習可用於訓練機器人來執行任務,例如在房間內走動,以及透過 AlphaGo 等軟體程式來玩 Go 遊戲。

生成式 AI

生成式 AI 是一種模型類別,可根據使用者輸入內容建立內容。舉例來說,生成式 AI 可製作獨特圖片、樂曲和笑話,能夠總結文章內容、解釋如何執行工作或編輯相片。

生成式 AI 可以採用各種輸入內容,產生各種輸出內容,例如文字、圖片、音訊和影片。也可能擷取並建立這些項目的組合舉例來說,模型可以擷取圖片做為輸入內容,建立圖片和文字做為輸出內容,或是擷取圖片和文字做為輸入內容,然後建立影片做為輸出內容。

我們可以透過輸入和輸出來討論生成式模型,這些模型通常以「輸入類型」轉換成「輸出類型」。例如,以下清單是生成式模型的部分輸入和輸出內容:

  • 文字轉文字
  • 文字轉圖片
  • 文字轉影片
  • 文字轉程式碼
  • 文字轉語音
  • 圖片和文字轉圖片

下表為生成式模型的範例、輸入內容,以及可能的輸出範例:

型號 輸入內容 輸出範例
文字轉文字 利曼競速賽的發明人是誰? 《24 Hours of Le Mans》是由 1906 年成立的汽車總署 Automobile Club de l'Ouest (ACO) 所創立。首場比賽於 1923 年 5 月 26 日和 27 日在薩爾蒂圓環上舉行,這條賽道是長 13.426 公里 (8.345 英里) 的道路,位於法國萊曼鎮。該種族最初是將其視為宣傳美國科羅拉多州和薩爾特地區的手段。
資料來源:Bard
文字轉圖片 外星章魚漂浮在傳送門看報紙的傳送門。 卡通章魚的圖片。
資料來源:Imagen
文字轉影片 一隻擬真的泰迪熊在舊金山的海洋游泳。泰迪熊潛入水中。泰迪熊戴著色彩繽紛的魚在水下游泳。熊貓在水下游泳。 影片:泰迪熊在水中游泳。
資料來源:Phenaki
文字轉程式碼 編寫會循環播放數字清單的 Python 迴圈,並輸出質數。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

資料來源:Bard
圖片轉文字 紅鶴的圖片。 這是紅鶴的聲音在加勒比海地區。
資料來源: Google DeepMind

生成式 AI 的運作方式為何?整體來說,生成式模型會在資料中學習模式,目標是產生類似的新資料。生成式模型如下所示:

  • 透過觀察人們的行為和方式來學習模仿他人的模特兒
  • 這些藝術家研究了大量繪畫風格,藉此學會畫出特定風格的繪畫
  • 聆聽樂團的音樂

為產生獨特且創意的輸出內容,生成式模型一開始會使用非監督方法訓練,讓模型學習模擬用來訓練的資料。系統有時會針對模型要求執行的工作,使用監督式或增強學習來進一步訓練模型,例如提供文章摘要或編輯相片。

生成式 AI 是一種快速演進的技術,持續發現新的應用實例。舉例來說,生成式模型可自動移除乾擾背景,或改善低解析度圖片的品質,協助商家修正電子商務產品圖片。