分類: ROC と AUC

前のセクションでは、1 対 1 で計算される一連のモデル指標を紹介しました。 適用できます。ただし、 モデルの品質をすべてのしきい値で測定するには、異なるツールが必要です。

受信者操作特性曲線(ROC)

ROC 曲線 すべてのしきい値におけるモデルのパフォーマンスを視覚的に表したものです。 受信者の操作特性という長い名称は 第二次世界大戦のレーダー探知機から生まれました。

ROC 曲線は、真陽性率(TPR)を計算して描画します。 と偽陽性率(FPR)が FPR に対する TPR をグラフ化します。完璧なモデル、 あるしきい値で TPR が 1.0、FPR が 0.0 のときに、 いずれかのポイントで表されるか、 他のすべてのしきい値が無視された場合は(0, 1)、または次の場合:

図 1. TPR(y 軸)と FPR(x 軸)のグラフ。
            完全なモデルの性能: (0,1) から (1,1) への直線。
図 1. 架空の完全モデルの ROC と AUC。

曲線下面積(AUC)

ROC 曲線の下の面積(AUC) ある確率で予測された確率が 陽性と陰性のサンプルがランダムに選択された場合、 表します。

辺の長さが 1 の正方形を含む上の完全なモデルは、 曲線下面積(AUC)は 1.0 です。これは 100% の確率でニューラル ネットワークの モデルは、ランダムに選択された陽性のサンプルを、 ランダムに選択されたネガティブな例です。言い換えれば、Google Chat の AUC は、モデルが予測を行う確率を ランダムに選択された円の右に、ランダムに選択された正方形の 表示されます。

スライダーなしのウィジェット データ線

より具体的に言うと、AUC を備えたスパム分類器は、 1.0 に設定すると、ランダムな迷惑メールに常に 迷惑メールに分類されます。各 Pod の実際の分類は、 選択したしきい値によって異なります。

バイナリ分類器の場合、ランダムな推測または コイン投げには(0,0)から(1,1)への対角線である ROC があります。AUC は 0.5 という確率で陽性と判定される確率は 50%、 ネガティブ サンプルです。

迷惑メール分類器の例では、AUC が 0.5 の迷惑メール分類器が、 ランダムなスパムメールでは、ランダムなスパムメールより 半分にとどまります

図 2. TPR(y 軸)と FPR(x 軸)のグラフ。
            ランダムな 50 対 50 の推測の結果: (0,0) からの対角線
            (1,1)に変更できます。
図 2. 完全にランダムな推測の ROC と AUC。

(任意、高度)適合率と再現率の曲線

AUC と ROC は、データセットがおおむね バランスを取る必要があります。データセットが不均衡な場合は、適合率と再現率の (PRC)とそれらの曲線の下の面積により、 モデルのパフォーマンスの可視化です。適合率と再現率の曲線は Y 軸に適合率、X 軸に再現率をプロットしています。 あります。

(0,1) から下向きの凸曲線がある適合率-再現率曲線の例
            ~(1,0)

モデルとしきい値を選択するための AUC と ROC

AUC は、2 つの異なるモデルのパフォーマンスを比較する際に有用な測定値です。 データセットがおおむね均衡していれば(適合率と再現率の曲線を参照)。 データセットの説明を参照)。下面積が大きいモデルは、 一般的には曲線の方が適切です。

<ph type="x-smartling-placeholder">
</ph> 図 3.aAUC=0.65 のモデルの ROC/AUC グラフ。 図 3.b:AUC=0.93 のモデルの ROC/AUC グラフ。
図 3.2 つの架空のモデルの ROC と AUC。グラフ上の曲線は、 右の AUC の値が大きいほど、2 つのモデルのどちらかが優れています。

ROC 曲線上の (0,1) に最も近い点は、 最もパフォーマンスの高いしきい値を 定義します詳しくは、 しきい値 混同行列 および 指標の選択とトレードオフ どのしきい値を選択するかは、このグラフで最も重要な 判断できます以下のポイント A、B、C について考えてみましょう。 それぞれがしきい値を表しています。

図 4. AUC=0.84 の ROC 曲線。
            曲線の(0,1)に最も近い凸部分に順に A、B、C というラベルを付けます。
図 4. しきい値を表すラベル付きの 3 つのポイント。

誤検出(誤検知)が大きな損害をもたらす場合は、 たとえ TPR であってもポイント A のように FPR が 削減されます逆に、偽陽性が安価で偽陰性が低い場合、 非常にコストがかかるポイント C のしきい値です TPR を最大化することが望ましい場合がある。費用がほぼ同じであればポイント B TPR と FPR のバランスが最適である可能性があります。

以下は、これまでに見たデータの ROC 曲線です。

演習:理解度をチェックする

実際には、ROC 曲線はイラストよりもはるかに規則的ではありません。 あります。次のうち、ROC 曲線で表されるモデルはどれですか。 最もパフォーマンスが高いのは
(0,0) から右に上向きに曲がる ROC 曲線
           (1、1)。この曲線の AUC は 0.77 です。
このモデルの AUC が最も高いのは、 向上します
(0,0) から(0,0)から
           (1,1) のようなものです。この曲線の AUC は 0.508 です。
(0,0) から (1,1) まで右にジグザグに伸びる ROC 曲線。
           この曲線の AUC は 0.623 です。
右向きと上向きの円弧
                (0,0) から (1,1) に変更します。この曲線の AUC は 0.31 です。
次のうち、パフォーマンスが偶然よりも低いモデルはどれですか。
右向きと上向きの円弧
                (0,0) から (1,1) に変更します。この曲線の AUC は 0.32 です。
このモデルの AUC は 0.5 未満であり、パフォーマンスが低い ありません。
ROC 曲線は、入力からほぼ直線で
                     (0,0) から (1,1) に分け、少しジグザグに折りたたんでください。この曲線には、
                     AUC は 0.508。
このモデルは、偶然よりもわずかにパフォーマンスが優れています。
からの対角線である ROC 曲線は、
                (0,0) から (1,1) に変更します。この曲線の AUC は 0.5 です。
このモデルは偶然と同じ性能を発揮します。
2 本の垂直線(1 本、1 本)で構成される ROC 曲線
      (0,0)から (0,1) への水平線と、(0,1) から (1,1) への水平線。
      この曲線の AUC は 1.0 です。
これは架空の完全分類器です。

(任意、上級)ボーナス質問

最悪の事態に対して行うことができる変更は、次のうちどれですか。 確率よりもパフォーマンスが優れているという意味です。
予測を逆にして、1 の予測を 00 の予測は1 になります。
バイナリ分類器が確実にサンプルを クラスのラベルが入れ替わることによって 予測の精度が上がります。しかも、予測の精度は モデルを再トレーニングします
常に陰性クラスを予測させる。
これにより、パフォーマンスが向上する場合もあれば、そうでない場合もあります。また 精度のセクションで説明したとおり これは有用なモデルではありません。
常に陽性クラスを予測させる。
これにより、パフォーマンスが向上する場合もあれば、そうでない場合もあります。また 精度のセクションで説明したとおり これは有用なモデルではありません。

たとえば、迷惑メールが特定のアカウントに届く前に 受信トレイに振り分ける必要はありません。これで、 この状況用に迷惑メール分類器をトレーニングし、 除外クラスは「No-Spam」です。 次のうち、 どうすればよいでしょうか?

AUC=0.84 の ROC 曲線。
       近接する曲線を作成します。ポイント A の距離は
       (0.25, 0.75)。ポイント B は約 (0.30, 0.90) にあり、
       FPR を最小化しながら TPR を最大化する点です。拡張ポイント
       C は約 (0.4, 0.95) です。
ポイント A
このユースケースでは、誤検出を最小限に抑え、 たとえ真陽性も減少したとしてもです
ポイント B
このしきい値は、真陽性と偽陽性のバランスを取ります。
ポイント C
このしきい値により真陽性が最大化(より多くの迷惑メールのフラグ) 代わりに 偽陽性(正当なメールを できます。