Learning
토픽 61 / 172·생성형 AI와 LLM 활용

확산 모델 (Diffusion Model)

확산 모델 (Diffusion Model)

데이터에 점진적으로 노이즈를 추가하는 전방 과정과 노이즈를 제거하며 데이터를 복원하는 역방 과정을 학습하여 고품질 이미지를 생성하는 생성 모델로, GAN을 대체하며 이미지 생성 분야의 최신 기술

특징: 점진적노이즈제거, 고품질, 학습안정, 다양성

동작원리

  • Forward Process: 깨끗한이미지 → 노이즈추가(T단계) → 완전노이즈
  • Reverse Process: 완전노이즈 → 노이즈예측·제거(T단계) → 깨끗한이미지

주요알고리즘: DDPM(Denoising Diffusion Probabilistic Model), DDIM(빠른샘플링), Latent Diffusion(잠재공간)

대표모델

  • DALL-E 2/3 (OpenAI): 텍스트→이미지, 고품질
  • Stable Diffusion: 오픈소스, Latent Diffusion, 빠름
  • Midjourney: 예술적, 고품질
  • Imagen (Google): 텍스트→이미지, 사실적

장점: GAN보다 안정적학습, 고품질, 다양성, 제어가능성

단점: 느린생성속도(단계많음), 계산비용

적용사례: 이미지생성(Midjourney), 이미지편집(InstructPix2Pix), 초해상도, 인페인팅

비교: GAN(빠름·불안정) vs Diffusion(느림·안정·고품질)

연관: 생성형AI, Stable Diffusion, DALL-E, GAN, Latent Diffusion