Learning
토픽 135 / 172·고급 학습 기법

Feature Engineering 기법 (Feature Engineering Techniques)

Feature Engineering 기법 (Feature Engineering Techniques)

원시 데이터에서 ML 모델의 성능을 향상시키는 유의미한 특징(Feature)을 생성, 변환, 선택하는 과정으로, 도메인 지식과 데이터 분석을 결합하여 모델 입력을 최적화

목적: 모델 성능 향상, 학습 효율화, 차원 축소, 해석 가능성 향상, 노이즈 감소

특징: 도메인 지식 중요, 반복적 프로세스, 데이터 유형별 기법, 자동화 가능

기법 유형

  • 수치형 변환:
  • 범주형 처리:
  • 시계열 특징:
  • 텍스트 특징: TF-IDF, Word2Vec, BERT Embedding, n-gram
  • Feature Selection: Filter(상관계수), Wrapper(RFE), Embedded(L1), Feature Importance

자동 Feature Engineering: Featuretools, AutoFeat, TPOT

장점: 성능 향상, 학습 효율, 해석 가능성, 차원 축소

단점: 도메인 지식 필요, 시간 소요, 과적합 위험, 데이터 누수

적용사례: 신용 평가, 추천 시스템, 이탈 예측, 수요 예측

비교: 수동 FE(도메인 지식) vs 자동 FE(도구) vs 딥러닝(자동 학습)

연관: 전처리, Feature Store, 모델 성능, EDA, 도메인 지식