토픽 93 / 116·차세대 컴퓨팅
AI 슈퍼컴퓨팅 플랫폼 (AI Supercomputing Platform)
AI 슈퍼컴퓨팅 플랫폼 (AI Supercomputing Platform)
대규모 AI 모델 학습/추론을 위해 수천~수만 GPU를 고속 인터커넥트로 연결한 초대규모 컴퓨팅 인프라
특징: Gartner 2026 Top Trend, NVLink/NVSwitch 기반 GPU 클러스터, InfiniBand 네트워크, 엑사스케일 전환
구성요소
- •GPU 노드: H100/B200 등 AI 가속기, 노드당 8GPU 구성
- •고속 인터커넥트: NVLink(GPU간 900GB/s), InfiniBand(노드간 400Gbps)
- •분산 스토리지: 병렬 파일시스템(Lustre, GPFS), 학습 데이터 고속 공급
- •작업 스케줄러: SLURM, Kubernetes 기반 GPU 작업 할당/관리
- •냉각 시스템: 수랭(Direct Liquid Cooling), 수만 GPU 발열 관리
비교
연관: GPU 컴퓨팅, 분산 학습, LLM, 엑사스케일, 데이터센터