Learning
토픽 183 / 210·법규 및 컴플라이언스

k-익명성 / l-다양성 / t-근접성

k-익명성 / l-다양성 / t-근접성

비식별 데이터셋에서 개인 재식별 위험을 정량적으로 평가하고 제어하는 프라이버시 모델

k-익명성 (k-Anonymity)

  • 정의: 준식별자(Quasi-Identifier) 조합이 동일한 레코드가 최소 k개 존재
  • 한계: 동질성 공격(민감 속성이 모두 동일), 배경지식 공격

l-다양성 (l-Diversity)

  • 정의: 동일 준식별자 그룹 내 민감 속성 값이 최소 l가지 이상 (동질성 공격 방어)
  • 한계: 확률적 추론(민감 속성 분포 편향), 유사성 공격

t-근접성 (t-Closeness)

  • 정의: 동일 그룹 내 민감 속성 분포와 전체 데이터셋 분포 간 거리가 t 이하 (EMD/Earth Mover's Distance)
  • 한계: 데이터 유용성 저하, 최적 t 결정 어려움

적용사례: 공공 데이터 공개, 의료 데이터 활용, 통계 연구, AI 학습 데이터

비교: k-익명성(기본/간단) → l-다양성(다양성 보강) → t-근접성(분포 유사성/최강)

연관: 비식별화, 차등 프라이버시, 개인정보보호, 데이터3법