什麼是機器學習?

機器學習 (ML) 是我們使用的一些重要技術 例如翻譯應用程式、自動駕駛車輛本課程將說明 瞭解機器學習背後的概念

機器學習能讓你以全新方式解決問題、回答複雜問題,以及 內容。機器學習技術可以預測天氣、預估交通時間、建議 提供歌曲、自動完成句子、總結文章重點,以及生成 先前從未見過的圖像

簡單來說,機器學習是 訓練是一段軟體 模型,將資料用於 預測或根據下列項目產生內容: 資料。

舉例來說,假設我們想要建立一個應用程式來預測降雨量。我們可以 可以採用傳統做法或機器學習方法使用 我們會以物理性的方式呈現地球大氣的樣貌 計算大量流體動態方程式這是 極為困難

採用機器學習技術 我們可以向機器學習模型產生大量的天氣資料 直到機器學習模型最終學習了 產生不同降雨量的天氣模式。接著 模擬目前的天氣資料 並預測降雨量

驗收學習成果

什麼是「模型」機器學習領域嗎?
模型是指機器學習資料衍生的數學關係 藉此做出預測
模型是電腦硬體的一種
模型會以較小形式呈現您所研究的事物。

機器學習系統類型

根據機器學習系統的方式,可分為以下一或多個類別 學習如何進行預測或產生內容:

  • 監督式學習
  • 非監督式學習
  • 強化學習
  • 生成式 AI

監督式學習

監督式學習 模型能根據大量資料和正確答案 進行預測 然後找出資料中各元素之間的關係 正確答案就像是學生透過 考考包含問答題和答案的舊制考試。學生 學生已學到足夠的舊制考試,也已經準備好參加新考試。 這些機器學習系統屬於「監督式」自然語言是人類給機器學習系統 包含已知正確結果的資料

監督式學習最常見的兩種用途是迴歸 例如單一語句分類

迴歸

「迴歸模型」可預測 數值。舉例來說,天氣模型會預測 吋或公釐) 是迴歸模型

如需更多迴歸模型的範例,請參閱下表:

情境 可能的輸入資料 數值預測
未來房屋價格 正方形影片片段、郵遞區號、臥室數量和浴室數、大小 抵押貸款利率、房產稅率、施工費用和 當地待售的房屋數量。 房價。
未來行程時間 歷來路況 (由智慧型手機收集、路況資訊) 感應器、叫車服務和其他導航應用程式),距離 目的地、天氣預報和天氣狀況 抵達目的地所需的時間 (以分和秒為單位)。

分類

分類模型可預測 某件事有屬於某個類別的可能性有別於迴歸模型 分類模型的輸出結果是數字,分類模型會輸出值 某些內容是否屬於特定類別例如: 分類模型可用於預測電子郵件是否為垃圾郵件或相片 內含貓

分類模型分為兩類:二元分類和 提供多元分類二元分類模型會透過 只包含兩個值的類別,例如 rainno rain。多重類別分類模型會從 含有超過兩個值的類別,例如模型可輸出 rainhailsnowsleet

驗收學習成果

如果想要使用機器學習模型預測商業用途的能源用量 您會使用哪種模型?
迴歸
能源用量的單位是千瓦時 (kWh),這是數字 所以要使用迴歸模型
分類
分類模型可預測事物是否屬於某個類別 迴歸模型會預測數字因為能源用量是以 千瓦時 (kWh) 為數字,而您想要使用迴歸模型。

非監督式學習

非監督式學習 模型會根據未含正確資料 都有可能非監督式學習模型的目標是找出 偵測出資料中的模式換句話說,模型不會提示如何 而是必須推論自己的規則。

常用的非監督式學習模型採用稱為 分群法。模型會尋找資料點 用來區分自然分組

顯示叢集內彩色圓點的圖片。

圖 1. 分群相似資料點的機器學習模型。

圖片:顯示叢集內各色圓點,並形成相框。

圖 2. 具有自然分類法的叢集群組。

分群與分類不同,因為類別 您。舉例來說,非監督式模型可能會根據 以及定義季度的區隔接著 並根據您對資料集的瞭解,為這些叢集命名。

圖片:顯示叢集中有不同顏色的圓點,標示為「雪」、「雨」、「冰雹」和「無雨」。

圖 3. 分群類似天氣模式的機器學習模型。

圖片顯示叢集中的彩色圓點,分類為雪、雨、冰雹,以及形狀中彼此環繞的雨水。

圖 4. 包含雪、凍雨、 降雨也沒有下雨

驗收學習成果

監督式方法與非監督式方法有何不同?
監督式方法所提供的資料含有正確答案。
監督式方法所提供的資料含有正確答案。 模型的工作是在資料中找出產生正確 回答的問題 以非監督式方法獲取資料,但又沒有正確答案。沒錯 是在資料中尋找群組
監督式方法通常使用分群法。
非監督式方法採用分群法
非監督式方法知道如何為資料叢集加上標籤。
非監督式方法不知道資料叢集代表的意義。 您可以根據對資料的瞭解,自行定義。

強化學習

強化學習 模型會根據獎勵 或懲處。援助 學習系統產生的政策 定義能賺取最多獎勵的最佳策略。

強化學習的用途是訓練機器人執行行走等工作 還有許多軟體程式 (例如 AlphaGo 一起玩「圍棋」

生成式 AI

生成式 AI 是一種模型 根據使用者輸入內容建立內容舉例來說,生成式 AI 可以 獨特圖片、樂曲和笑話;生成文章摘要 說明如何執行工作或編輯相片。

生成式 AI 可以接受各種輸入內容,並生成各種輸出內容,例如 像是文字、圖片、音訊和影片等還可以使用 這些原則舉例來說,模型可將圖片做為輸入內容 也能將圖片和文字做為輸入內容,製作成影片做為輸出內容。

我們可以依據輸入內容和輸出內容來討論生成式模型 例如「輸入類型」-至「輸出類型」例如,以下是 生成式模型的部分輸入和輸出內容清單:

  • 文字轉文字
  • 文字轉圖片
  • 文字轉影片
  • 文字轉程式碼
  • 文字轉語音
  • 圖片和文字轉圖片

下表列出生成式模型的範例、相關輸入內容, 可能的輸出內容範例:

型號 輸入 輸出範例
文字轉文字 利曼競速賽由誰發明? Automobile Club de l'Ouest 是 24 小時 Le Mans 的創辦人 成立於 1906 年的汽車組織。首次舉辦比賽 時間為 1923 年 5 月 26 日和 27 日,位於「Sarthe Circuit」(13.426 公里) 位於法國勒曼市附近的道路電路 (8.345 英里)。 這場競賽的起源是提高 ACO,以及 探索地區。
資料來源:Bard
文字轉圖片 外星章魚漂浮在入口上看報紙。 卡通章魚的圖片。
資料來源:Imagen
文字轉影片 看似逼真的泰迪熊在舊金山享受游泳。 泰迪熊會在水面下。泰迪熊陪伴游泳 五彩繽紛的魚熊貓在水下游泳。 泰迪熊在水下游泳的影片。
資料來源:Phenaki
文字轉程式碼 編寫 Python 迴圈,這個迴圈會循環處理數字清單,並輸出質數。
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

資料來源:Bard
圖片轉文字 火鶴的圖片。 這是紅鶴的聲音。它們出現在加勒比海地區。
資料來源: Google DeepMind

生成式 AI 的運作方式為何?生成式模型的概略說明 資料模式,目標是產生類似的新資料。生成式 如下所示:

  • 說明如何觀察人們的行為並學會仿冒他人身分的騙局 說話風格
  • 藉由研究多種因素,學會繪畫特定風格的藝術家 同類型畫作
  • 藉由聆聽 該團體的許多音樂

為了產生獨特且富有創意的輸出內容,生成式模型一開始經過訓練 非監督式方法,讓模型學習模仿 模型有時會使用監督式或 對於與模型相關的特定資料 例如總結文章或編輯相片

生成式 AI 是迅速演進的技術,能不斷發掘新用途 適時適地曝光舉例來說,生成式模型 自動移除乾擾背景的電子商務產品圖片 或提升低解析度圖像的品質