분류 문제의 평가지표 완벽 정리_ADsP 3과목

🧩 분류 문제의 평가지표 완벽 정리 💡

📘 Accuracy · Precision · Recall(민감도/TPR) · Specificity · F1 · ROC-AUC · PR-AUC · MCC · 오분류율 · FPR 포함!

🎯 1️⃣ 혼동행렬(Confusion Matrix) 기본 이해

📌 모든 평가지표는 이 TP, FP, FN, TN에서 파생됩니다!

📊 2️⃣ 주요 평가지표 한눈 정리

지표	의미	공식	해석
🎯 정확도 (Accuracy)	전체 중 맞춘 비율	(TP+TN)/(TP+FP+FN+TN)	전체 예측이 얼마나 맞았는가
⚠️ 오분류율 (Misclassification Rate)	틀린 비율	(FP+FN)/전체 = 1−Accuracy	낮을수록 좋음
💡 정밀도 (Precision)	예측 양성 중 진짜 양성	TP/(TP+FP)	“양성이라 한 것”의 신뢰도
🔍 재현율 (Recall, Sensitivity)	실제 양성 중 잘 찾아낸 비율	TP/(TP+FN)	놓치지 않는 능력
❤️ 민감도 (Sensitivity)	= 재현율(Recall) = TPR(True Positive Rate)	TP/(TP+FN)	실제 양성을 얼마나 잘 감지하는가
🧯 특이도 (Specificity)	실제 음성 중 잘 맞춘 비율	TN/(TN+FP)	오탐을 줄이는 능력
🚨 FPR(False Positive Rate)	거짓 양성 비율	FP/(FP+TN) = 1−특이도	실제 음성을 양성으로 잘못 분류한 비율
⚖️ F1-Score	정밀도·재현율의 조화평균	2×(P×R)/(P+R)	불균형 데이터에서 균형 평가
📈 ROC-AUC	ROC 곡선 면적(TPR vs FPR)	–	임계값 전 구간의 분류 성능
📉 PR-AUC	Precision–Recall 곡선 면적	–	양성이 희소할 때 유용
🧠 MCC (Matthews Corr. Coef.)	전체 균형 상관계수	–	불균형에도 강건

🧮 3️⃣ 예시로 계산해보기 ✏️

가정: 전체 200건 중

TP=40, FP=10, FN=20, TN=130

💬 해석

⚙️ 4️⃣ TPR과 FPR의 관계

📈 ROC 곡선 (Receiver Operating Characteristic)

💡 트레이드오프

📘 5️⃣ 불균형 데이터에서는?

🧮 6️⃣ 다중분류 평균 방식 요약

✅ 불균형이면 macro-F1 또는 weighted-F1 사용 추천!

🧾 7️⃣ ADsP 시험 포인트 💡

🔹 민감도 = 재현율 = TPR, 특이도와 FPR은 반비례 관계

🔹 오분류율 = 1−정확도

🔹 F1은 정밀도·재현율의 균형 평가

🔹 ROC-AUC vs PR-AUC → 희소 양성일수록 PR-AUC

🔹 Macro / Micro / Weighted 구분 필수

🔹 임계값 조정은 TPR–FPR 트레이드오프 핵심

🌈 8️⃣ 한 줄 요약

💬 “분류 평가지표의 핵심은 TP·FP·FN·TN!

민감도(TPR)는 놓치지 않는 힘, FPR은 불필요한 오탐의 비율,

오분류율은 Accuracy의 반대 개념!”

🎯 ADsP 시험 포인트: 불균형 데이터 → F1·PR-AUC 중심으로 보자!