토픽 83 / 111·병렬 처리 (Parallel Processing)
GPU (Graphics Processing Unit)
GPU (Graphics Processing Unit)
대규모 병렬 처리에 특화된 프로세서로, 수천 개의 작은 코어를 통해 그래픽 렌더링과 범용 병렬 계산(GPGPU)을 고속으로 수행
목적: 그래픽 렌더링, 병렬 계산, 대규모 데이터 처리, AI/ML 가속
특징: 대규모 병렬(수천 코어), SIMT(Single Instruction Multiple Thread), 높은 처리량, 메모리 대역폭
아키텍처
- •NVIDIA: CUDA 코어, SM(Streaming Multiprocessor), Tensor Core, RT Core
- •AMD: Stream Processor, CU(Compute Unit), RDNA/CDNA
- •코어: 단순한 ALU, 낮은 클럭, 대규모 병렬
GPGPU(General Purpose GPU): 범용 계산, CUDA/OpenCL/ROCm, AI/ML/과학계산
메모리: GDDR6/HBM2(높은 대역폭, 수백GB/s), VRAM, 공유 메모리, L2 캐시
성능: TFLOPS 단위, FP32/FP16/INT8, Tensor Core(행렬곱 가속)
장점: 대규모 병렬, 높은 처리량, AI/ML 최적, 높은 메모리 대역폭
단점: 분기 비효율, 높은 레이턴시, 프로그래밍 복잡도, 전력 소모
적용사례: 딥러닝(PyTorch/TensorFlow), 과학계산, 암호화폐 채굴, 렌더링, 영상처리
비교: GPU(대규모병렬/높은처리량) vs CPU(범용/낮은레이턴시/분기최적)
연관: CUDA, Tensor Core, SIMD, 병렬 처리, AI 가속기