Learning
토픽 22 / 172·머신러닝 기초

분류 알고리즘

분류 알고리즘

입력 데이터를 사전 정의된 범주나 클래스 중 하나로 할당하는 지도학습 알고리즘으로, 이메일 스팸 필터, 이미지 인식, 질병 진단 등 이산적 출력이 필요한 예측 문제에 사용

목적: 데이터를 정확한 범주로 분류, 의사결정 자동화

주요알고리즘

  • Logistic Regression (로지스틱 회귀):
  • Naive Bayes: 확률기반, 조건부독립가정, 텍스트분류
  • SVM: 마진최대화, 커널트릭, 비선형분류
  • Decision Tree: 규칙기반, CART·ID3·C4.5, 해석가능
  • Random Forest: 다수 트리 앙상블, 배깅, 과적합 방지
  • XGBoost/LightGBM: 그래디언트부스팅, 순차적학습, 최고성능
  • K-NN: 유사샘플기반, 게으른학습, 거리기반

평가지표: Accuracy(정확도), Precision(정밀도), Recall(재현율), F1 Score(조화평균), ROC-AUC(임계값성능)

적용사례: 스팸필터(Naive Bayes), 이미지분류(CNN), 신용평가(XGBoost), 질병진단(SVM)

비교: 분류(이산범주) vs 회귀(연속수치)

연관: 지도학습, Logistic Regression, SVM, Decision Tree, Random Forest, XGBoost