Computer >> 컴퓨터 >  >> 프로그램 작성 >> 프로그램 작성

ROC 곡선이란 무엇입니까?

<시간/>

ROC는 수신기 작동 특성을 나타냅니다. ROC 곡선은 두 가지 분류 모델을 분석하기 위한 편리한 시각적 도구입니다. ROC 곡선은 2차 세계 대전 중 레이더 이미지 검색을 위해 생성된 신호 탐지 이론에서 나타납니다.

ROC 곡선은 주어진 모델에 대한 참 긍정 비율 또는 민감도(인식된 긍정 튜플의 비율)와 거짓 긍정 비율(긍정적으로 잘못 인식된 부정 튜플의 비율) 간의 균형을 표시합니다.

2-클래스 문제가 주어지면 모델이 '예' 사례를 정확하게 식별할 수 있는 비율과 여러 '부분에 대해 '아니오' 사례를 '예'로 잘못 인식하는 비율 간의 균형을 예상할 수 있습니다. " 테스트 세트의. 참양성률의 일부 증가는 거짓양성률의 증가 값에서 나타납니다. ROC 곡선 아래의 영역은 모델의 정확도를 평가하는 것입니다.

주어진 분류 모델 M에 대한 ROC 곡선을 작동할 수 있으며, 모델은 모든 테스트 튜플의 예측 클래스에 대한 확률 또는 순위를 반환할 수 있어야 합니다. 테스트 튜플을 내림차순으로 순위를 매기는 것이 필요하며 분류자가 일반적으로 긍정적인 클래스에 속하거나 '예' 클래스가 목록의 맨 위에 있다고 생각하는 튜플이 발생합니다.

나이브 베이지안 및 역전파 분류기가 적절하지만 결정 트리 분류기를 포함하면 모든 예측에 대해 클래스 확률 분포를 반환하도록 간단히 변경할 수 있습니다. ROC 곡선의 수직축은 진정한 양수율을 정의합니다. 가로축은 위양성 비율을 정의합니다. M에 대한 ROC 곡선은 다음과 같이 표시됩니다.

이것은 왼쪽 하단 모서리(참 긍정 비율과 거짓 긍정 비율이 모두 0인 경우)에서 시작하여 목록의 첫 번째 부분에서 튜플의 실제 클래스 레이블을 테스트할 수 있습니다. 그것이 참 긍정(즉, 올바르게 정의된 양의 튜플)이면 ROC 곡선에서 위로 변경되어 점을 그릴 수 있습니다.

두 분류 모델의 ROC 곡선을 표시합니다. 플롯은 또한 이러한 모델의 각 참 긍정에 대해 일반적으로 거짓 긍정이 발생하는 대각선을 표시합니다.

따라서 모델의 ROC 곡선이 대각선에 가까울수록 모델의 효율성이 떨어집니다. 모델이 가장 좋은 경우 원래 순위 목록에서 아래로 변경될 수 있으므로 참 긍정이 발생할 가능성이 높습니다. 따라서 곡선은 0에서 위로 가파르게 이동할 수 있습니다. 나중에 점점 더 적은 수의 참양성(true positive)과 점진적으로 거짓양성(false positive)이 발생하기 시작할 수 있으므로 곡선이 줄어들고 더 수평이 됩니다.