Learning
토픽 39 / 107·클라우드 인프라 서비스

GPU 클라우드 / AI 인프라 최적화 (vGPU, MIG)

GPU 클라우드 / AI 인프라 최적화 (vGPU, MIG)

GPU 자원을 가상화·분할하여 다수 사용자/워크로드에 효율적으로 할당하는 클라우드 인프라 기술

특징: GPU 사용률 극대화(단일 GPU 유휴 방지), 멀티테넌트 지원, 워크로드별 자원 격리, TCO 절감(GPU 구매·전력 비용 절감)

종류

  • vGPU(NVIDIA GRID): 시분할 가상화, 하이퍼바이저 기반, VM마다 가상 GPU 할당, VDI/추론 적합
  • MIG(Multi-Instance GPU): A100/H100 물리 분할(최대 7개), 메모리·SM 완전 격리, 독립 GPU처럼 동작
  • MPS(Multi-Process Service): CUDA 컨텍스트 공유, 다수 프로세스 GPU 스트림 동시 사용, 경량 공유
  • Time-Slicing: K8s GPU 시분할, 소프트웨어 스케줄링, 격리 없음, 소규모 추론 적합

비교

클라우드 서비스 적용: AWS(EC2 vGPU/p5 MIG), Azure(NV시리즈 vGPU/ND시리즈 MIG), GCP(A3 MIG/GPU 시분할)

연관: AI 데이터센터 인프라, GPU 컴퓨팅, 가상화, Kubernetes, HPC