Learning
토픽 150 / 172·고급 학습 기법

합성 데이터 (Synthetic Data)

합성 데이터 (Synthetic Data)

실제 데이터의 통계적 특성을 모방하여 인위적으로 생성한 데이터

특징: 프라이버시 보호(↑), 대량 생성, 원본과 유사, 편향 위험

구성요소: 원본 데이터, 생성 모델, 검증, 활용 환경

기술요소: GAN, VAE, 통계적 생성, 시뮬레이션

적용사례: AI 훈련 데이터, 테스트 데이터, 의료 데이터 대체

비교: 합성데이터(생성/프라이버시) vs 실제데이터(수집/민감)

연관: AI, 프라이버시, 데이터 증강