토픽 149 / 172·고급 학습 기법
ROC Curve / AUC (Receiver Operating Characteristic)
ROC Curve / AUC (Receiver Operating Characteristic)
분류 모델의 성능을 임계값 변화에 따른 TPR(True Positive Rate, 민감도)과 FPR(False Positive Rate, 1-특이도) 관계로 시각화하는 곡선
특징: 임계값 독립적 평가, 전체적 분류 성능 파악, 모델 간 비교 용이
축: X축 = FPR(False Positive Rate), Y축 = TPR(True Positive Rate = Recall)
AUC (Area Under the Curve): ROC 곡선 아래 면적, 0~1 범위
- •AUC = 1.0: 완벽한 분류
- •AUC = 0.5: 랜덤 분류(대각선)
- •AUC < 0.5: 랜덤보다 나쁨
장점: 임계값 독립적 평가, 불균형 데이터에도 유용, 모델 비교 용이
혼동 행렬 (Confusion Matrix): TP(참긍정), FP(거짓긍정), TN(참부정), FN(거짓부정) → Precision(정밀도), Recall(재현율), F1-Score(조화평균), Accuracy(정확도)
PR Curve (Precision-Recall Curve): 불균형 데이터에서 ROC보다 유용, AP(Average Precision)
비교: ROC-AUC(균형데이터·전체성능) vs PR-AUC(불균형데이터·양성클래스중심) vs F1(단일임계값·조화평균)
연관: 분류, 평가 지표, 머신러닝, 통계