Learning
토픽 83 / 111·병렬 처리 (Parallel Processing)

GPU (Graphics Processing Unit)

GPU (Graphics Processing Unit)

대규모 병렬 처리에 특화된 프로세서로, 수천 개의 작은 코어를 통해 그래픽 렌더링과 범용 병렬 계산(GPGPU)을 고속으로 수행

목적: 그래픽 렌더링, 병렬 계산, 대규모 데이터 처리, AI/ML 가속

특징: 대규모 병렬(수천 코어), SIMT(Single Instruction Multiple Thread), 높은 처리량, 메모리 대역폭

아키텍처

  • NVIDIA: CUDA 코어, SM(Streaming Multiprocessor), Tensor Core, RT Core
  • AMD: Stream Processor, CU(Compute Unit), RDNA/CDNA
  • 코어: 단순한 ALU, 낮은 클럭, 대규모 병렬

GPGPU(General Purpose GPU): 범용 계산, CUDA/OpenCL/ROCm, AI/ML/과학계산

메모리: GDDR6/HBM2(높은 대역폭, 수백GB/s), VRAM, 공유 메모리, L2 캐시

성능: TFLOPS 단위, FP32/FP16/INT8, Tensor Core(행렬곱 가속)

장점: 대규모 병렬, 높은 처리량, AI/ML 최적, 높은 메모리 대역폭

단점: 분기 비효율, 높은 레이턴시, 프로그래밍 복잡도, 전력 소모

적용사례: 딥러닝(PyTorch/TensorFlow), 과학계산, 암호화폐 채굴, 렌더링, 영상처리

비교: GPU(대규모병렬/높은처리량) vs CPU(범용/낮은레이턴시/분기최적)

연관: CUDA, Tensor Core, SIMD, 병렬 처리, AI 가속기