Learning
토픽 63 / 172·생성형 AI와 LLM 활용

GAN (Generative Adversarial Network)

GAN (Generative Adversarial Network)

생성자(Generator)와 판별자(Discriminator)가 적대적으로 경쟁하며 학습하여 실제와 구분 불가능한 가짜 데이터를 생성하는 생성 모델로, 이미지 생성·변환·복원 등에 활용

특징: 적대적학습, Min-Max게임, 생성자+판별자, 비지도학습

구조

  • Generator: 노이즈(z)→가짜데이터, 실제같은데이터생성목표
  • Discriminator: 실제/가짜 판별, 이진분류, 정확한판별목표
  • 학습: G는 D를 속이려함, D는 구분하려함, 경쟁으로 개선

손실함수: Min-Max Loss, G↓ D↑ (동시최적화)

주요변형

  • DCGAN: 합성곱 사용, 안정적 학습
  • WGAN: Wasserstein Distance, 학습안정화
  • StyleGAN: 스타일제어, 고해상도 얼굴생성
  • CycleGAN: 쌍없는이미지변환(말↔얼룩말)

도전과제: 학습불안정(모드붕괴), 기울기소실, 하이퍼파라미터민감

적용사례: 얼굴생성(StyleGAN), 이미지변환(Pix2Pix), 초해상도(SRGAN), 딥페이크

장단점: 장점(고품질·샘플링빠름) 단점(학습불안정·모드붕괴)

비교: GAN(적대적·빠름·불안정) vs VAE(재구성·안정·흐림) vs Diffusion(점진·안정·느림)

연관: 생성형AI, StyleGAN, CycleGAN, 확산모델, VAE