Learning
토픽 36 / 172·딥러닝

혼동 행렬 (Confusion Matrix)

혼동 행렬 (Confusion Matrix)

분류 모델의 예측 결과와 실제 값을 2×2(이진) 또는 N×N(다중 클래스) 행렬로 정리하여 모델 성능을 다각도로 평가하는 도구

목적: 분류 모델의 정확한 성능 평가, 오분류 유형별 분석

  • TP(True Positive): 양성을 양성으로 정확히 예측
  • FP(False Positive, Type I Error): 음성을 양성으로 잘못 예측
  • FN(False Negative, Type II Error): 양성을 음성으로 잘못 예측
  • TN(True Negative): 음성을 음성으로 정확히 예측

파생 지표

  • Accuracy(정확도): (TP+TN)/(TP+FP+FN+TN), 전체 정확률, 클래스 불균형 시 오도 가능
  • Precision(정밀도): TP/(TP+FP), 양성 예측 중 실제 양성 비율, 스팸 필터(FP 최소화)
  • Recall(재현율/민감도): TP/(TP+FN), 실제 양성 중 탐지 비율, 질병 진단(FN 최소화)
  • F1-Score: 2×Precision×Recall/(Precision+Recall), Precision-Recall 조화 평균
  • Specificity(특이도): TN/(TN+FP), 실제 음성 중 올바르게 음성 예측 비율

클래스 불균형 문제: 99:1 비율에서 모두 음성 예측 시 Accuracy 99%이나 Recall 0%, F1-Score/AUROC/AUPRC가 더 적절한 지표

비교: Accuracy(전체/불균형시부적절) vs F1(정밀도·재현율균형) vs AUROC(임계값독립/종합)

연관: 분류, 과적합, ROC 곡선, 클래스 불균형, 모델 평가