토픽 16 / 172·머신러닝 기초
지도학습 (Supervised Learning)
지도학습 (Supervised Learning)
입력(X)과 정답 레이블(Y)이 쌍으로 주어진 데이터로 입력-출력 매핑 함수를 학습하는 방식으로, 분류와 회귀 문제를 해결하며 명확한 목표값이 있는 예측 문제에 적합
특징: 레이블 필요, 정확한 예측, 정량적 평가, 높은 데이터 비용
구성요소: 학습데이터(X,Y쌍), 레이블(정답), 특징(속성), 모델(매핑함수), 손실함수(오차), 검증데이터(튜닝), 테스트데이터(평가)
문제유형
- •분류: 이산적 범주 예측, Cross Entropy, Accuracy·Precision·Recall
- •회귀: 연속적 수치 예측, MSE·MAE, RMSE·R²
알고리즘
- •선형모델: Linear Regression, Logistic Regression, Ridge, Lasso
- •트리기반: Decision Tree, Random Forest, XGBoost, LightGBM
- •기타: K-NN, Naive Bayes, SVM, MLP, CNN, RNN
도전과제: 레이블링비용(액티브러닝·준지도학습), 과적합(정규화·드롭아웃·교차검증), 클래스불균형(리샘플링·SMOTE·가중치조정)
평가방법: 홀드아웃(70/15/15 분할), K-겹교차검증(K번 반복), 계층화K-겹(클래스비율유지)
적용사례: 스팸필터링(나이브베이즈), 신용평가(XGBoost), 질병진단(CNN), 집값예측(회귀), 불량품검출(SVM)
비교: 분류(이산적범주) vs 회귀(연속적수치)
연관: 머신러닝, 분류, 회귀, 비지도학습, 과적합, 교차검증, 특징공학