토픽 115 / 210·사이버 공격 및 위협
데이터 포이즈닝 (Data Poisoning)
데이터 포이즈닝 (Data Poisoning)
AI 모델의 학습 데이터에 의도적으로 오염된 데이터를 주입하여 모델 동작을 조작하는 공격
특징
- •학습 단계 공격: 추론이 아닌 훈련 과정을 표적
- •탐지 어려움: 오염 데이터가 정상 데이터와 유사하게 위장
- •모델 성능 저하: 전체 정확도 하락 또는 특정 입력 오분류 유도
- •공급망 위협: 공개 데이터셋/사전학습 모델을 통한 간접 주입
종류
- •Label Flipping: 레이블 변조(정상→악성, 악성→정상으로 레이블 교체)
- •Clean-Label: 정상 레이블 유지하면서 특징 공간에서 교란(탐지 극히 어려움)
- •Backdoor Injection: 트리거 패턴 삽입(특정 패턴 입력 시에만 오동작)
방어: 데이터 검증/정제, 이상치 탐지, Robust Aggregation, 출처 검증, 차등 프라이버시
비교
연관: AI/ML 보안, 적대적 공격, Backdoor Attack, 공급망 보안