分類:ROC 和 AUC

上一節會展示一組模型指標,且所有指標都是以 單一分類門檻值但如果你想評估 整體可能門檻的模型品質,您需要不同的工具。

接收者操作特徵曲線 (ROC)

ROC 曲線 以視覺化方式呈現所有門檻的模型成效。 全名為接收器操作特性 。

系統會計算真陽率 (TPR) 來繪製 ROC 曲線 和偽陽率 (FPR) 在所有可能門檻 (實務上, ),然後繪製 TPR 除以 FPR。完美模型 調整特定門檻的 TPR 為 1.0,FPR 為 0.0 以 (0, 1) 則忽略其他門檻,或符合以下規定:

圖 1. 與 FPR (X 軸) 的 TPR (Y 軸) 圖
            最佳模型的效能:從 (0,1) 到 (1,1) 的線條。
圖 1:ROC 和 AUC,這是一個完美假設的模型。

曲線下的面積 (AUC)

ROC 曲線下面積 (AUC) 代表模型 假如隨機選擇的正面和負面示例,將為 正好大於負數

以上最完美的模型 (內含邊長為 1 的正方形) 設有 曲線 (AUC) 的 1.0 曲線這表示 100% 的機率 模型會正確地為隨機選擇的正值評分 隨機選出的排除範例也就是觀察 下列資料點,則「AUC」能指出模型達成此目標的機率 隨機選擇的圓形右側的正方形,與 門檻設定

小工具資料行 (不含滑桿)

具體來說,我們使用 AUC 的垃圾郵件分類器進行分類 1.0 的垃圾郵件將一律由隨機垃圾郵件指派, 垃圾郵件。每項工具實際分類後 電子郵件會根據您選擇的閾值。

如果是二進位分類器,則具備完全與隨機猜測或隨機猜測的模型 擲硬幣的 ROC 是從 (0,0) 到 (1,1) 的對角線。AUC 是 0.5 代表有 50% 的機率 排除範例

在垃圾郵件分類器範例中,含有 AUC 為 0.5 的垃圾郵件分類器指派了 比起隨機傳送,隨機的垃圾郵件更有可能成為垃圾郵件 只有一半的時間支援正常電子郵件。

圖 2:與 FPR (X 軸) 的 TPR (Y 軸) 圖
            隨機測出 50 到 50 名猜測字的對角線長 (0,0) 的對角線
            (1,1)。
圖 2 ROC 和 AUC 完全隨機猜測。

(選用,進階) 精確度與喚回度曲線

當資料集粗略估計時,AUC 和 ROC 適合用來比較模型 並在類別之間平衡資料集不平衡時,精確度和喚回度 曲線 (PRC) 和曲線下的面積可能會提供更準確的比較結果 視覺化呈現模型成效精確度與喚回度曲線的建立方式 在 X 軸和 閾值

精確度與喚回度曲線範例,具有向下的凸面曲線從 (0,1)
            到 (1,0)

用於選擇模型和門檻的 AUC 和 ROC

AUC 很適合用來比較兩個不同模型 但前提是資料集要大致達到平衡(請參閱精確度與喚回度曲線, 以達到不平衡的資料集)。中面積較大的模型 通常代表曲線較佳。

圖 3.a.AUC=0.65 模型的 ROC/AUC 圖。 圖 3.b.AUC=0.93 模型的 ROC/AUC 圖。
圖 3.包含兩個假想模型的 ROC 和 AUC。圖表上的 而 AUC 越多代表這兩個模型越好

ROC 曲線上最接近 (0,1) 的點表示 指定模型表現最佳門檻。如 門檻 混淆矩陣選擇指標和權衡取捨 系統會根據您的 特定用途考慮下列中的 A、B 和 C 點 圖表,每個圖表都代表一個門檻:

圖 4. AUC=0.84 的 ROC 曲線顯示
            最接近 (0,1) 標籤的捲積部分,依序加上 A、B、C 標籤。
圖 4. 三個加上標籤的點,代表閾值。

如果偽陽性 (誤報) 的成本極高,可能會發生 選擇 FPR 較低的閾值,例如 TPR 的閾值 成本下降反過來說,如果偽陽性和偽陰性越便宜 (遺漏真陽性) 極高的成本,C 點門檻 最大化 TPR,可能比較適合如果費用大致相同,請 B 點 或許可以在 TPR 與 FPR 之間取得最佳平衡

我們看過資料的 ROC 曲線如下:

練習:隨堂測驗

實務上,ROC 曲線的規律程度遠低於插圖 。下列哪些型號以 ROC 曲線表示 和 AUC 的成效最好嗎?
ROC 曲線依序從 (0,0) 延伸至
           (1、1)。曲線的 AUC 為 0.77。
這個模型的 AUC 最高,對應最佳的 AUC 才需進行
ROC 曲線大約從 (0,0) 到
           (1,1),加上幾條鋸齒狀。曲線的 AUC 為 0.508。
ROC 曲線往右滑動 (0,0) 到 (1,1)。
           曲線的 AUC 為 0.623。
ROC 曲線往右往右繞行
                (0,0) 到 (1,1)。曲線的 AUC 為 0.31。
下列哪一種模型的成效比機率低?
ROC 曲線往右往右繞行
                (0,0) 到 (1,1)。曲線的 AUC 為 0.32。
這個模型的 AUC 低於 0.5,代表效能不如預期 效果更勝以往
ROC 曲線,約為
                     (0,0) 到 (1,1),曲線有代表
                     AUC 為 0.508。
這個模型的成效稍微優於機率。
ROC 曲線是
                (0,0) 到 (1,1)。曲線的 AUC 為 0.5。
這個模型的成效與機率相同。
ROC 曲線由兩條垂直線組成:一個垂直線
      從 (0,0) 到 (0,1) 的線條,以及從 (0,1) 到 (1,1) 的水平線。
      這條曲線的 AUC 為 1.0。
這是假定的完美分類器。

(選用,進階) 加分題

以下何者可以大幅修改 模型為何表現優於機率?
反轉預測結果,因此 1 的預測結果會變為 0,而 0 的預測是 1
如果二元分類器確實地提供範例, 出錯率過高,導致需要切換課程標籤 就能立即讓預測結果更勝於機會 重新訓練模型
讓它一律預測負類別。
實驗成效不一定能提高。此外, 中所述的「準確度」一節 因此不是很實用的模型
讓它一律預測正向類別。
實驗成效不一定能提高。此外, 中所述的「準確度」一節 因此不是很實用的模型

想想看,有些垃圾郵件送到 ,將重要業務電子郵件傳送至垃圾郵件資料夾。您 但正好有正向類別 而且排除類別不是垃圾郵件 以下哪個要點? 在 ROC 曲線上,您比較滿意分類器嗎?

AUC=0.84 的 ROC 曲線顯示了
       接近 (0,1) 的曲線。A 點大約等於
       (0.25, 0.75)。B 點大約為 (0.30, 0.90),
       盡可能提高 TPR 的成效,同時盡量降低 FPR。點
       C 約為 (0.4, 0.95)。
A 點
在此使用案例中,較理想的情況是 盡量減少偽陽性情形 即使真陽性也會下降
B 點
這個門檻可以平衡真陽性和偽陽性。
C 點
這個門檻可讓真正的陽性結果最大化 (檢舉更多垃圾內容) 提高誤報的代價 (將比我們更正常的電子郵件 垃圾郵件)。