토픽 183 / 210·법규 및 컴플라이언스
k-익명성 / l-다양성 / t-근접성
k-익명성 / l-다양성 / t-근접성
비식별 데이터셋에서 개인 재식별 위험을 정량적으로 평가하고 제어하는 프라이버시 모델
k-익명성 (k-Anonymity)
- •정의: 준식별자(Quasi-Identifier) 조합이 동일한 레코드가 최소 k개 존재
- •한계: 동질성 공격(민감 속성이 모두 동일), 배경지식 공격
l-다양성 (l-Diversity)
- •정의: 동일 준식별자 그룹 내 민감 속성 값이 최소 l가지 이상 (동질성 공격 방어)
- •한계: 확률적 추론(민감 속성 분포 편향), 유사성 공격
t-근접성 (t-Closeness)
- •정의: 동일 그룹 내 민감 속성 분포와 전체 데이터셋 분포 간 거리가 t 이하 (EMD/Earth Mover's Distance)
- •한계: 데이터 유용성 저하, 최적 t 결정 어려움
적용사례: 공공 데이터 공개, 의료 데이터 활용, 통계 연구, AI 학습 데이터
비교: k-익명성(기본/간단) → l-다양성(다양성 보강) → t-근접성(분포 유사성/최강)
연관: 비식별화, 차등 프라이버시, 개인정보보호, 데이터3법