解決機器學習問題

根據預測結果 判斷問題最好的方式 您現在已準備好用機器學習術語來構思問題。 完成下列工作,即可依據機器學習術語找出問題:

  • 定義理想的結果和模型的目標。
  • 識別模型的輸出內容。
  • 定義成效指標。

定義理想的結果和模型的目標

未採用機器學習模型,理想的結果為何?也就是 例如您希望產品或功能執行的確切工作原來是 先前在說明目標一節中定義的語句 專區。

藉由明確定義 讓模型執行下表說明理想的結果, 假設模型的目標:

應用程式 理想成果 模型的目標
「天氣」應用程式 以六小時為單位計算地理區域的降水量。 預測特定地理區域的六小時降水量。
時尚應用程式 產生各種襯衫設計。 根據文字和圖片生成三種襯衫設計 其中文字會指出樣式和顏色,而圖片則是 襯衫 (T 恤、鈕扣、馬球)。
影片應用程式 推薦實用影片。 預測使用者是否點選影片。
郵件應用程式 偵測垃圾內容。 預測電子郵件是否為垃圾郵件。
金融應用程式 摘要列出多個新聞來源的財經資訊。 根據 Google Cloud 業務中 。
地圖應用程式 計算交通時間。 預測兩點之間移動所需時間。
銀行應用程式 識別詐欺交易。 預測持卡人是否完成交易。
用餐應用程式 依據餐廳的菜單辨識料理。 預測餐廳類型。
電子商務應用程式 生成關於公司產品的客戶服務回覆。 運用情緒分析和機構的 知識庫

找出需要的輸出內容

要選擇的模型類型取決於 問題。模型的輸出內容應會完成 找出理想結果因此,第一個要回答的問題是 「使用哪種輸出方式解決我的問題?」

如果需要分類或進行數值預測 也能使用預測式機器學習如果需要產生新內容或 這可能會使用生成式 AI

下表列出預測式機器學習和生成式 AI 輸出內容:

表 1. 預測機器學習
機器學習系統 輸出範例
分類 二進位數 將電子郵件分類為垃圾郵件或非垃圾郵件。
多類別單一標籤 將圖片中的動物分類。
多類別多標籤 將圖片中的所有動物分類。
數值 單維迴歸 預測影片獲得的觀看次數。
多維度迴歸 預測血壓、心率和膽固醇濃度 模型
表 2. 生成式 AI
模型類型 輸出範例
文字
提供文章重點摘要。

回覆顧客評論。

將文件從英文翻譯成中文。

撰寫產品說明。

分析法律文件。
圖片
產生行銷圖片。

為相片套用視覺效果。

產生產品設計變化版本。
音訊
以特定口音產生對話。

生成短音樂作品等特定類型的音樂,例如 爵士樂。
視訊
生成逼真的影片。

分析影片片段並套用視覺效果。
多模態 產生多種類型的輸出內容,例如含有字幕的影片。

分類

分類模型 預測輸入資料屬於哪個類別,例如輸入內容 應歸類為 A、B 或 C。

分類模型正在進行預測。

圖 1. 進行預測的分類模型。

應用程式可能會根據模型的預測結果做出決定。舉例來說 預測結果是類別 A,然後執行 X;如果預測值是 B 類別,則 do、Y;如果預測結果是類別 C,則務必 Z。在某些情況下 應用程式的輸出內容。

產品程式碼會使用模型的輸出內容做出決定。

圖 2. 在產品程式碼中使用分類模型輸出內容 做出決定

迴歸

迴歸模型可預測 也就是數值

迴歸模型正在進行預測,

圖 3. 進行數字預測的迴歸模型。

應用程式可能會根據模型的預測結果做出決定。舉例來說 預測結果落在 A 範圍之內,執行 X如果預測值落在範圍內 B,做 Y;如果預測結果落在 C 範圍內,就應該 Z。在某些情況下, 預測「是」應用程式的輸出內容。

產品程式碼會使用模型的輸出內容做出決定。

圖 4. 產品程式碼中使用迴歸模型的輸出內容 做出決策

請參考下列情境:

您想要快取 根據預測的熱門程度搜尋影片也就是說 預測影片將會很受歡迎,所以您可能會想快速向使用者提供影片。目的地: 如此一來,您就可以使用更有效且昂貴的快取。至於其他影片 使用不同的快取您的快取條件如下:

  • 如果影片預計可獲得 50 次以上觀看次數,則不用付費 快取。
  • 假設系統預測影片觀看次數介於 30 到 50 次之間,您就可以選用 快取。
  • 如果影片預計獲得不到 30 次觀看,您就不會快取 影片。

你認為迴歸模型是正確的做法 數值,也就是觀看次數。但在訓練迴歸模型時 就會發現兩者產生的 預測結果 28 和 32的損失 觀看次數達 30 次的影片換句話說,雖然您的應用程式 當預測結果是 28 與 32 時,模型會同時考量兩者 而且預測結果一樣好

正在訓練模型並評估其損失。

圖 5. 訓練迴歸模型。

迴歸模型不知道產品定義的門檻。因此,如果您的 應用程式的行為會大幅改變,因為 迴歸模型預測 分類模型

在這種情況下,分類模型就會產生正確的行為 因為分類模型的預測 28 比 32。理論上,分類模型預設會產生門檻。

本情境強調兩個重點:

  • 預測決策。請盡可能預測應用程式的 取而代之在影片範例中,分類模型會預測 偵測影片分類後是否會「沒有快取」"便宜 快取」「高昂的快取」從模型中隱藏應用程式行為 會導致應用程式產生錯誤的行為。

  • 瞭解問題限制。如果您的應用程式使用 會依據不同的門檻偵測動作 固定或動態變動

    • 動態門檻:如果閾值是動態的,請使用迴歸模型 ,並在應用程式的程式碼中設定閾值限制。方便您輕鬆使用 更新門檻,同時讓模型 預測結果
    • 固定門檻:如果門檻固定,請使用分類模型 並根據門檻限制為資料集加上標籤

    一般來說,大部分的快取佈建作業都是動態的,且門檻會變動 長期下來。由於這是快取問題 迴歸模型是最佳選擇不過,在許多問題中 使分類模型成為最佳解決方案

接著再舉一個例子。如果要建構的天氣應用程式 最理想的結果是讓使用者知道接下來 6 小時內會下雨。 您可以用迴歸模型來預測「precipitation_amount.」標籤

理想成果 理想標籤
告知使用者所在地區的降雨量 在接下來的 6 小時 precipitation_amount

在天氣應用程式範例中,標籤會直接說明理想結果。 但在某些情況下,一對一 並加上理想結果和標籤以影片應用程式為例,理想的結果是 推薦實用影片。但在名為 useful_to_user.

理想成果 理想標籤
推薦實用影片。 ?

因此,您必須找出 Proxy 標籤。

Proxy 標籤

Proxy 標籤替代 也就是不在資料集內的標籤 直接測量想要預測的內容在影片應用程式中,我們無法 評估使用者是否會覺得影片很實用如果 資料集具有 useful 功能,使用者標示了自己找到的所有影片 但由於資料集不需要,因此我們需要一個 Proxy 標籤 以及實用性的替代方法

提供便利性的 Proxy 標籤 能指出使用者會分享或按讚 影片。

理想成果 Proxy 標籤
推薦實用影片。 shared OR liked

請謹慎使用 Proxy 標籤,因為這類標籤無法直接評估所需內容 以便預測例如,下表概述了潛在的問題 推薦實用影片的 Proxy 標籤:

Proxy 標籤 問題
預測使用者是否點選「喜歡」按鈕。 大部分的使用者都不會按下「喜歡」。
預測影片是否熱門。 非個人化搜尋結果。部分使用者可能會不喜歡熱門影片。
預測使用者是否分享影片。 部分使用者不會分享影片。有時觀眾分享影片的原因 他們「不喜歡」
預測使用者是否點選播放。 盡量提高誘餌式點擊。
預測觀眾觀看影片的時間長度。 比起短片,長片較喜歡長篇影片。
預測使用者再次觀看影片的次數。 喜好項目:「可重複觀看」不能重複觀看的影片類型更勝以往

沒有任何替代標籤能取代理想結果。所有人都將 都可能發生潛在問題請挑選您最不容易問題的 具體來說,您可以設計提示來解決業務工作

驗收學習成果

有一家公司想在健康與保健應用程式中使用機器學習技術, 人們會覺得越來越好您認為他們需要使用 Proxy 標籤才能 協助他們實現目標?
是的,公司必須尋找 Proxy 標籤。類別如下: 無法直接衡量幸福和身心健康。他們必須 與其他功能 (例如花費的時數) 視為約略值 每週運動,或是從事嗜好或朋友互動的時間。
否,該公司不需要使用 Proxy 標籤。幸福與身心健康 可直接衡量

代別

在多數情況下,您不需要訓練自己的生成式模型,因為這麼做的用意是 需要大量的訓練資料和運算資源 您將自訂預先訓練的生成式模型為了取得 產生所需的輸出內容,您可能需要使用下列一或多項 技巧:

  • 精煉作業。如要建立 並產生合成標籤資料集 並使用較大型的模型來訓練較小型的模型生成式 模型通常無害且耗用大量資源 (例如記憶體) 電費、電力) 和電力) 搭配。精煉作業可以用來建構規模較小、所需資源較少 以估算大型模型的成效

  • 微調高效調整參數: 如要提升特定工作上的模型效能,您需要 用來訓練模型,該資料集含有您的輸出類型範例 想要製作的內容

  • 提示工程:目的地: 取得模型執行特定工作 您要生成特定格式的輸出內容 該如何執行或說明輸出結果的格式。也就是說 提示可以包含如何執行工作的自然語言指示 或舉例說明想輸出的內容

    舉例來說,如果您想獲得文章摘要,可以在 包括:

    Produce 100-word summaries for each article.
    

    如要讓模型產生特定讀物分級的文字 那麼,您可以輸入:

    All the output should be at a reading level for a 12-year-old.
    

    如果您希望模型以特定格式提供輸出內容,您可以 說明輸出內容的格式,例如「格式化 或展示工作成果 用自己的例子來說明舉例來說,您可以輸入以下內容:

    Translate words from English to Spanish.
    
    English: Car
    Spanish: Auto
    
    English: Airplane
    Spanish: Avión
    
    English: Home
    Spanish:______
    

精煉與微調會更新模型的 參數。提示工程 模型的參數不會更新相反地,提示工程可以 模型會學習如何根據提示內容生成所需的輸出內容

在某些情況下,您還需要 測試資料集來評估 根據已知值對生成式模型輸出內容 模型的摘要與人類生成的摘要相似 模型的摘要品質也很好

生成式 AI 也能用來導入預測式機器學習 例如分類或迴歸 舉例來說,因為他們對自然語言有深厚的瞭解 大型語言模型 (LLM) 可能比預測式機器學習更能有效執行文字分類工作 特定任務訓練而成

定義成效指標

定義您用來決定機器學習實作的指標 代表成功。成效指標可以定義您重視的指標,例如參與度或 協助使用者採取適當行動,例如觀看他們找到的影片 很實用成效指標與模型的評估指標不同,例如 準確率精確度喚回度,或 AUC

舉例來說,天氣應用程式的成功和失敗指標可以定義為 包括:

成功 使用者開啟「會下雨嗎?」產品特色
失敗 使用者開啟「會下雨嗎?」功能的頻率 。

影片應用程式指標的定義可能如下:

成功 使用者在網站上停留的時間平均增加 20%。
失敗 相較於過去,使用者平均在網站上停留的時間不多。

建議您定義明確的成效指標。目標過高會造成資料缺口 成功與失敗之間取得平衡舉例來說,使用者 網站停留時間比以往多 10%,既不是成功,也沒有失敗。 間隔未定義並不重要。

重要的是,模型能否更接近 成功的定義舉例來說,分析模型的 請思考以下問題:改善模型能否讓您獲得 最貼近您訂定的成功標準?例如,模型可能 但不會讓你更接近成功標準 就算是完美的模型,還是無法達到 另一方面,模型的評估指標可能偏低 就接近成功標準,這意味著改善模型 逐步邁向成功

以下是判斷模型是否價值時需考慮的維度 改善:

  • 非常好,但請繼續。模型不應用於 但長期下來這個架構可能會大幅改善。

  • 夠好了,請繼續。模型可用於正式環境 也可能會精進

  • 不錯,但無法再精益求精。模型處於正式環境 但一定可以做到。

  • 能力不足,永遠不會改變。模型不應用於 而且不多進行的訓練都有機會達成這個目標

在決定改善模型時,請重新評估資源是否增加 例如工程時間和運算成本 模型

定義成功和失敗指標後,您需要決定多久 進行評估例如,您可以測量成效指標 六 啟動系統後的 15 天、6 週或 6 個月。

在分析失敗指標時,請嘗試判斷系統失敗的原因。適用對象 例如,模型可能預測使用者會點選哪些影片 模型可能會開始建議 使用者參與度 提高點擊的誘餌式點擊標題 落地生意。在天氣應用程式範例中,模型可能會準確預測 可能會下雨,但地理區域過大

驗收學習成果

一家時尚公司想提高服飾銷售量。有人建議使用機器學習技術 決定要製造哪件衣服。他們認為自己可以 訓練模型來判斷衣服的類型。更新後 訓練模型時,會想將模型套用至目錄 各種衣服

他們該如何以機器學習術語來構思問題?

理想成果:決定要製造哪些產品。

模型的目標:預測哪些服飾文章出現在 。

模型輸出:二進位分類、in_fashionnot_in_fashion

成效指標:衣服銷量 70% 以上 執行。

理想成果:判斷要訂購的布料和用品。

模型的目標:預測每個商品的製造量。

模型輸出:二進位分類、makedo_not_make

成效指標:衣服銷量 70% 以上 執行。

最佳成果並不是判斷需要多少材質和補給品 順序。代表要判斷是否應製造特定項目。因此, 目標未能正確排除目標