토픽 117 / 122·비교표
CPU (Central Processing Unit)
CPU vs GPU vs NPU
| 항목 | CPU | GPU | NPU |
|---|---|---|---|
| 특화 | 범용 연산 | 대규모 병렬 연산 | AI/DNN 특화 |
| 코어 수 | 수~수십 개 (복잡) | 수천 개 (단순) | 수백~수천 PE |
| 레이턴시 | 낮음 (분기 최적) | 높음 | 중간 |
| 처리량 | 낮음 | 매우 높음 | 높음 (AI 한정) |
| 전력 | 중간 | 높음 | 낮음 |
| 적용 | 범용 제어, OS | 그래픽, 병렬계산, AI 학습 | AI 추론, 엣지 |
ALU vs FPU vs GPU ALU
| 항목 | ALU | FPU | GPU ALU |
|---|---|---|---|
| 연산 | 정수, 논리 연산 | 부동소수점 연산 | 단순 산술 연산 |
| 위치 | CPU 내장 | CPU 보조/내장 | GPU 내 대규모 병렬 |
| 범용성 | 범용 | 특화 | 데이터 병렬 |
하드와이어드 vs 마이크로프로그램 제어
| 항목 | 하드와이어드 | 마이크로프로그램 |
|---|---|---|
| 구현 | 조합 논리 회로 | 마이크로명령어 ROM |
| 속도 | 빠름 | 느림 |
| 수정 | 어려움 (회로 변경) | 용이 (마이크로코드 변경) |
| 적용 | RISC | CISC |
CISC vs RISC
| 항목 | CISC | RISC |
|---|---|---|
| 명령어 | 복잡, 다양, 가변길이 | 단순, 기본, 고정길이 |
| 주소지정 | 다양한 모드, 메모리 직접 연산 | 단순 모드, Load/Store 구조 |
| 파이프라인 | 어려움 (가변길이) | 최적화 (고정길이, 1사이클) |
| 코드 밀도 | 높음 (적은 명령어 수) | 낮음 (많은 명령어 수) |
| 전력 | 높음 | 낮음 |
| 적용 | x86, x86-64 (Intel/AMD) | ARM, MIPS, RISC-V |
ARM vs x86 vs RISC-V
| 항목 | ARM | x86 | RISC-V |
|---|---|---|---|
| ISA 유형 | RISC | CISC (내부 RISC) | RISC |
| 라이선스 | ARM Holdings 라이선스 | Intel/AMD 독점 | 오픈소스/무료 |
| 전력 효율 | 높음 (저전력) | 낮음 (고전력) | 높음 (설계 자유) |
| 생태계 | 성숙 (모바일 지배) | 매우 성숙 (PC/서버) | 발전 중 |
| 확장성 | 제한적 (라이선스) | 폐쇄적 | 무제한 (커스텀 확장) |
| 적용 | 모바일, 임베디드, 서버 | PC, 서버 | IoT, AI 가속기, 교육 |
파이프라인 해저드: 데이터 vs 제어 vs 구조적
| 항목 | 데이터 해저드 | 제어 해저드 | 구조적 해저드 |
|---|---|---|---|
| 원인 | 명령어 간 데이터 의존성 | 분기 명령어 | 하드웨어 자원 충돌 |
| 유형 | RAW, WAR, WAW | 분기 예측 실패 | 동시 자원 접근 |
| 해결 | 포워딩, 리네이밍 | 분기 예측, 지연 슬롯 | 자원 복제 (I/D캐시 분리) |
슈퍼스칼라 vs SMT vs VLIW
| 항목 | 슈퍼스칼라 | SMT | VLIW |
|---|---|---|---|
| 병렬성 | ILP (단일스레드) | TLP (다중스레드) | ILP (컴파일러 의존) |
| 스케줄링 | 동적 (HW) | 동적 (HW) | 정적 (컴파일러) |
| HW 복잡도 | 높음 | 중간 (추가 레지스터) | 낮음 |
| 적용 | Intel Core, AMD Ryzen | Hyper-Threading, IBM Power | DSP (TI), Itanium |
OoO (비순차 실행) vs In-Order (순차 실행)
| 항목 | Out-of-Order | In-Order |
|---|---|---|
| 실행 순서 | 의존성 없으면 먼저 실행 | 프로그램 순서대로 실행 |
| HW 복잡도 | 높음 (ROB, 리네이밍) | 낮음 |
| 성능 | 높은 IPC | 낮은 IPC |
| 전력 | 높음 | 낮음 |
| 적용 | Intel Core, AMD Ryzen | ARM Cortex-A53, IoT |
Spectre vs Meltdown
| 항목 | Spectre | Meltdown |
|---|---|---|
| 대상 CPU | 모든 CPU (Intel/AMD/ARM) | 주로 Intel, 일부 ARM/IBM |
| 공격 대상 | 응용프로그램 메모리 | 커널 메모리 |
| 원리 | 분기 예측 조작 + 캐시 사이드채널 | 권한 검사 전 투기적 실행 |
| 완화 | Retpoline, IBRS/IBPB | KPTI (커널 페이지 테이블 격리) |
분기 예측: 2-bit vs gshare vs Perceptron
| 항목 | 2-bit 포화 카운터 | gshare | Perceptron |
|---|---|---|---|
| 원리 | 4상태 FSM | GHR XOR PC | ML 가중치 학습 |
| 복잡도 | 단순 | 중간 | 높음 |
| 정확도 | 보통 | 높음 (상관 분기) | 매우 높음 |
| 적용 | 초기 CPU | 현대 CPU 기본 | 최신 CPU (AMD) |