토픽 73 / 111·I/O·버스 (I/O & Bus)
NVLink
NVLink
NVIDIA가 개발한 GPU 간 및 GPU-CPU 간 초고속 인터커넥트 기술로, PCIe의 대역폭 한계를 극복하여 대규모 AI/HPC 워크로드의 GPU 간 통신 성능을 극대화
목적: GPU 간 초고속 통신, 멀티 GPU 스케일링, 통합 메모리 접근, AI 학습 가속
특징: 양방향 고대역폭, GPU 간 직접 연결, 통합 메모리(Unified Memory), 캐시 일관성
세대별 성능
- •NVLink 1.0(Pascal, 2016): 양방향 80GB/s(링크당 40GB/s)
- •NVLink 2.0(Volta, 2017): 양방향 300GB/s, GPU-CPU 지원(IBM Power9)
- •NVLink 3.0(Ampere, 2020): 양방향 600GB/s, 12링크
- •NVLink 4.0(Hopper, 2022): 양방향 900GB/s, NVSwitch 3.0
- •NVLink 5.0(Blackwell, 2024): 양방향 1.8TB/s
NVSwitch: NVLink 스위치 칩, 다수 GPU를 All-to-All 연결, DGX 시스템에서 8GPU 풀메시
장점: PCIe 대비 5~14배 대역폭, 통합 메모리 공간, 멀티 GPU 선형 확장
단점: NVIDIA 전용(벤더 종속), 높은 비용, 제한된 연결 거리
적용사례: DGX H100/B200, HPC 클러스터, 대규모 LLM 학습, 과학 시뮬레이션
비교: NVLink(NVIDIA전용/900GB/s+/GPU간) vs CXL(개방표준/64GB/s/CPU-가속기) vs PCIe 5.0(범용/128GB/s/x16)
연관: GPU, CXL, PCIe, 멀티 GPU, AI 가속기, DGX