Learning
토픽 171 / 172·고급 학습 기법

Model Collapse (모델 붕괴)

Model Collapse (모델 붕괴)

AI가 생성한 합성 데이터로 반복 학습 시 출력 다양성이 감소하고 품질이 급격히 저하되는 현상

특징

  • 분포 축소: 세대 반복할수록 tail(저빈도) 분포 소실
  • 2024 Nature 논문: "AI models collapse when trained on recursively generated data" 공식 명명
  • LLM/이미지 생성 모두 해당: 텍스트, 이미지 등 생성 모델 공통 문제
  • 웹 데이터 오염: AI 생성 콘텐츠가 웹에 축적되며 학습 데이터 품질 저하

동작원리

비교