Learning
토픽 115 / 210·사이버 공격 및 위협

데이터 포이즈닝 (Data Poisoning)

데이터 포이즈닝 (Data Poisoning)

AI 모델의 학습 데이터에 의도적으로 오염된 데이터를 주입하여 모델 동작을 조작하는 공격

특징

  • 학습 단계 공격: 추론이 아닌 훈련 과정을 표적
  • 탐지 어려움: 오염 데이터가 정상 데이터와 유사하게 위장
  • 모델 성능 저하: 전체 정확도 하락 또는 특정 입력 오분류 유도
  • 공급망 위협: 공개 데이터셋/사전학습 모델을 통한 간접 주입

종류

  • Label Flipping: 레이블 변조(정상→악성, 악성→정상으로 레이블 교체)
  • Clean-Label: 정상 레이블 유지하면서 특징 공간에서 교란(탐지 극히 어려움)
  • Backdoor Injection: 트리거 패턴 삽입(특정 패턴 입력 시에만 오동작)

방어: 데이터 검증/정제, 이상치 탐지, Robust Aggregation, 출처 검증, 차등 프라이버시

비교

연관: AI/ML 보안, 적대적 공격, Backdoor Attack, 공급망 보안