분류: ROC 및 AUC

이전 섹션에서는 모두 한 번에 계산된 모델 측정항목 집합을 제시했습니다. 단일 분류 임곗값입니다. 그러나 '주목하는 방법'을 모델의 품질을 개선하는 데 도움이 되므로 다양한 도구가 필요합니다.

수신자 조작 특성 곡선 (ROC)

ROC 곡선 모든 임곗값의 모델 성능을 시각적으로 나타낸 것입니다. 긴 버전의 이름, 수신자 조작 특성은 탐지하기 시작했습니다.

ROC 곡선은 참양성률 (TPR)을 계산하여 그립니다. 거짓양성률(FPR)과 거짓양성률을 선택한 간격), 그런 다음 FPR을 통해 TPR을 그래프로 표시합니다. 완벽한 모델은 일부 임곗값에서 TPR이 1.0이고 FPR이 0.0인 경우 점 또는 경계선의 (0, 1) 다른 모든 임곗값이 무시되거나 다음에 의해 무시되는 경우:

그림 1. 다음을 보여주는 FPR (x축)에 대한 TPR (y축)의 그래프
            (0,1)에서 (1,1)까지의 선으로 표현할 수 있습니다.
그림 1. 가상의 완벽한 모델의 ROC 및 AUC입니다.

곡선 아래 면적 (AUC)

ROC 곡선 아래 영역 (AUC) 모델이 '양성'과 '음수' 예가 무작위로 선정된 경우 확인할 수 있습니다

변의 길이가 1인 정사각형을 포함하는 위의 완벽한 모델은 변이 1인 경우 1.0의 곡선 아래 면적 다시 말해 100% 오류가 발생할 모델이 무작위로 선택된 양성 예제의 순위를 무작위로 선택한 부정적인 예입니다. 다시 말해, 퍼블릭 클라우드의 확산을 AUC는 모델이 특정 의자를 배치할 확률을 제곱과 관계없이 무작위로 선택된 원의 오른쪽에 있는 임곗값을 설정합니다

슬라이더가 없는 위젯 데이터 줄

좀 더 구체적으로 말하면 AUC를 사용하는 스팸 분류기 항상 무작위로 스팸 이메일이 스팸일 수 있습니다. 각 포드의 실제 분류는 선택하는 임계값에 따라 달라집니다.

이진 분류기의 경우, 임의의 추측과 정확하게 일치하는 모델 또는 동전 던지기에는 (0,0)에서 (1,1)까지의 대각선인 ROC가 있습니다. AUC는 0.5로, 임의의 양성 예측과 제외 예시.

스팸 분류기 예에서 AUC가 0.5인 스팸 분류기는 임의의 스팸 이메일보다 스팸일 확률이 더 높은 이메일 스팸이 아닌 이메일의 경우

그림 2. 다음을 보여주는 FPR (x축)에 대한 TPR (y축)의 그래프
            (0,0)에서 대각선으로 추출한 50~50명의 랜덤 추측을 합친 결과를 얻게 됩니다.
            (1,1)이 됩니다.
그림 2. ROC와 AUC입니다.

(선택사항, 고급) 정밀도-재현율 곡선

AUC 및 ROC는 데이터 세트가 대략 클래스 간 균형을 유지합니다. 데이터 세트의 균형이 맞지 않는 경우 정밀도-재현율은 더 나은 비교 결과를 제공할 수 있는데, 모델 성능을 시각화합니다 정밀도-재현율 곡선은 다음에 의해 생성됩니다. y축에 정밀도를 표시하고 x축에 재현율을 표시 있습니다

(0,1)에서 하향 볼록 곡선을 사용하는 정밀도-재현율 곡선 예
            ~ (1,0)

모델 및 임곗값 선택을 위한 AUC 및 ROC

AUC는 서로 다른 두 모델의 실적을 비교하는 데 유용한 데이터 세트가 대략적으로 균형을 이루고 있는 한 데이터를 집계할 수 있습니다 (정밀도-재현율 곡선 참고, (불균형 데이터 세트의 경우) 아래 영역이 더 큰 모델 일반적으로 곡선이 더 좋습니다.

<ph type="x-smartling-placeholder">
</ph> 그림 3.a. AUC=0.65인 모델의 ROC/AUC 그래프 <ph type="x-smartling-placeholder">그림 3.b. AUC=0.93인 모델의 ROC/AUC 그래프</ph>
그림 3. 두 가상 모델의 ROC 및 AUC 의 곡선은 AUC가 클수록 두 모델 중 더 나은 것을 나타냅니다.

(0,1)에 가장 가까운 ROC 곡선상의 점들은 가장 높은 성능을 보이는 임곗값입니다. 앞서 말씀드린 것처럼 기준점, 혼동 행렬측정항목 선택 및 절충점 선택하는 임계값이 가장 중요한 측정항목을 기준으로 구체적인 사용 사례를 알아보겠습니다 다음에서 점 A, B, C를 고려하세요. 각각 임곗값을 나타냄

그림 4. 세 점을 보여주는 AUC=0.84의 ROC 곡선
            A,B, C라고 표시된 (0, 1)에 가장 가까운 곡선의 볼록 부분을 순서대로 표시합니다.
그림 4. 임곗값을 나타내는 라벨이 지정된 3개 포인트

오탐 (오탐)에 많은 비용이 많이 드는 경우, TPR이 있더라도 A 지점에서처럼 더 낮은 FPR을 제공하는 임곗값을 선택합니다. 감소합니다 반대로 거짓양성이 비용이 적게 들고 거짓음성인 경우 많은 비용이 들며, 포인트 C의 임곗값은 TPR을 최대화하는 것이 바람직할 수 있습니다. 비용이 거의 동일하다면 B 포인트입니다. TPR과 FPR 사이의 최적의 균형을 제공할 수 있습니다.

다음은 이전에 확인한 데이터의 ROC 곡선입니다.

연습문제: 학습 내용 점검하기

실제로 ROC 곡선은 그림보다 훨씬 덜 규칙적입니다. 나타냅니다. 다음 중 ROC 곡선으로 표시되는 모델은 무엇인가요? 실적이 가장 우수한가요?
(0,0)에서 오른쪽 방향으로 위쪽으로 원호를 그리는 ROC 곡선
           (1,1) 곡선의 AUC는 0.77입니다.
이 모델의 AUC가 가장 높고 확인할 수 있습니다
(0,0)에서 (0,0)까지의 대략적인 직선인 ROC 곡선
           (1,1), 몇 개의 지그재그로 이루어져 있습니다. 곡선의 AUC는 0.508입니다.
(0,0)에서 (1,1)까지 위쪽과 오른쪽으로 지그재그로 움직이는 ROC 곡선입니다.
           곡선의 AUC는 0.623입니다.
오른쪽으로 원호를 그리며 위쪽을 향하는 ROC 곡선
                (0,0)에서 (1,1)까지입니다. 곡선의 AUC는 0.31입니다.
다음 중 성능이 우연히 저조한 모델은 무엇인가요?
오른쪽으로 원호를 그리며 위쪽을 향하는 ROC 곡선
                (0,0)에서 (1,1)까지입니다. 곡선의 AUC는 0.32입니다.
이 모델의 AUC가 0.5 미만이므로 성능이 저하됩니다. 가능성이 높습니다.
그래프에서 다음과 같은 직선으로 표현된 ROC 곡선입니다.
                     (0,0)에서 (1,1)까지, 몇 개의 지그재그로 구성됩니다. 곡선에는
                     AUC: 0.508
이 모델은 우연보다 약간 더 나은 성능을 발휘합니다.
방사선으로부터의 대각선 직선인 ROC 곡선
                (0,0)에서 (1,1)까지입니다. 곡선의 AUC는 0.5입니다.
이 모델은 우연과 동일하게 실행됩니다.
수직선 2개(수직선)로 구성된 ROC 곡선
      (0,0)에서 (0,1)까지의 선과 (0,1)에서 (1,1)까지의 가로선입니다.
      이 곡선의 AUC는 1.0입니다.
이는 가상의 완벽한 분류기입니다.

(선택사항, 고급) 보너스 질문

다음 중 가능성이 낮다고 할 수 있는 변경사항은 무엇인가요? 모델이 우연보다 더 나은 성능을 발휘하도록 해야 할까요?
예측을 반대로 하여 1의 예측이 0이면 예측이 0이면 1이 됩니다.
이진 분류기가 신뢰할 수 있는 방법으로 잘못된 클래스가 많아져서 클래스 라벨을 즉시 우연보다 더 나은 예측을 제공합니다. 모델을 다시 학습시킵니다.
항상 네거티브 클래스를 예측하도록 합니다.
이로 인해 성능이 개선될 수도 있고 향상되지 않을 수도 있습니다. 또한 정확성 섹션에서 논의하고, 이는 유용한 모델이 아닙니다.
항상 포지티브 클래스를 예측하도록 합니다.
이로 인해 성능이 개선될 수도 있고 향상되지 않을 수도 있습니다. 또한 정확성 섹션에서 논의하고, 이는 유용한 모델이 아닙니다.

어떤 스팸이 스팸이 18,000원에 도달하는 것이 더 좋은 사용하는 것이 더 낫습니다. 이미 포지티브 클래스가 네거티브 클래스는 스팸이 아닙니다 다음 중 어느 점 어느 것이 더 낫습니까?

AUC=0.84의 ROC 곡선, 그래프의 볼록 부분에 3개의 점이 표시됨
       (0,1)에 가까운 곡선입니다. A 지점은 대략
       (0.25, 0.75). 포인트 B는 약 (0.30, 0.90)에 있고,
       FPR을 최소화하면서 TPR을 최대화하는 지점입니다. 점
       C는 약 (0.4, 0.95)입니다.
포인트 A
이 사용 사례에서는 거짓양성을 최소화하는 것이 더 좋습니다. 참양성도 감소하더라도 말이죠
포인트 B
이 임곗값은 참양성과 거짓양성의 균형을 유지합니다.
포인트 C
이 기준점은 참양성을 최대화합니다 (더 많은 스팸 신고). 오탐률은 더 높아질 수 있습니다 스팸).