Learning
토픽 117 / 122·비교표

CPU (Central Processing Unit)

CPU vs GPU vs NPU

항목CPUGPUNPU
특화범용 연산대규모 병렬 연산AI/DNN 특화
코어 수수~수십 개 (복잡)수천 개 (단순)수백~수천 PE
레이턴시낮음 (분기 최적)높음중간
처리량낮음매우 높음높음 (AI 한정)
전력중간높음낮음
적용범용 제어, OS그래픽, 병렬계산, AI 학습AI 추론, 엣지

ALU vs FPU vs GPU ALU

항목ALUFPUGPU ALU
연산정수, 논리 연산부동소수점 연산단순 산술 연산
위치CPU 내장CPU 보조/내장GPU 내 대규모 병렬
범용성범용특화데이터 병렬

하드와이어드 vs 마이크로프로그램 제어

항목하드와이어드마이크로프로그램
구현조합 논리 회로마이크로명령어 ROM
속도빠름느림
수정어려움 (회로 변경)용이 (마이크로코드 변경)
적용RISCCISC

CISC vs RISC

항목CISCRISC
명령어복잡, 다양, 가변길이단순, 기본, 고정길이
주소지정다양한 모드, 메모리 직접 연산단순 모드, Load/Store 구조
파이프라인어려움 (가변길이)최적화 (고정길이, 1사이클)
코드 밀도높음 (적은 명령어 수)낮음 (많은 명령어 수)
전력높음낮음
적용x86, x86-64 (Intel/AMD)ARM, MIPS, RISC-V

ARM vs x86 vs RISC-V

항목ARMx86RISC-V
ISA 유형RISCCISC (내부 RISC)RISC
라이선스ARM Holdings 라이선스Intel/AMD 독점오픈소스/무료
전력 효율높음 (저전력)낮음 (고전력)높음 (설계 자유)
생태계성숙 (모바일 지배)매우 성숙 (PC/서버)발전 중
확장성제한적 (라이선스)폐쇄적무제한 (커스텀 확장)
적용모바일, 임베디드, 서버PC, 서버IoT, AI 가속기, 교육

파이프라인 해저드: 데이터 vs 제어 vs 구조적

항목데이터 해저드제어 해저드구조적 해저드
원인명령어 간 데이터 의존성분기 명령어하드웨어 자원 충돌
유형RAW, WAR, WAW분기 예측 실패동시 자원 접근
해결포워딩, 리네이밍분기 예측, 지연 슬롯자원 복제 (I/D캐시 분리)

슈퍼스칼라 vs SMT vs VLIW

항목슈퍼스칼라SMTVLIW
병렬성ILP (단일스레드)TLP (다중스레드)ILP (컴파일러 의존)
스케줄링동적 (HW)동적 (HW)정적 (컴파일러)
HW 복잡도높음중간 (추가 레지스터)낮음
적용Intel Core, AMD RyzenHyper-Threading, IBM PowerDSP (TI), Itanium

OoO (비순차 실행) vs In-Order (순차 실행)

항목Out-of-OrderIn-Order
실행 순서의존성 없으면 먼저 실행프로그램 순서대로 실행
HW 복잡도높음 (ROB, 리네이밍)낮음
성능높은 IPC낮은 IPC
전력높음낮음
적용Intel Core, AMD RyzenARM Cortex-A53, IoT

Spectre vs Meltdown

항목SpectreMeltdown
대상 CPU모든 CPU (Intel/AMD/ARM)주로 Intel, 일부 ARM/IBM
공격 대상응용프로그램 메모리커널 메모리
원리분기 예측 조작 + 캐시 사이드채널권한 검사 전 투기적 실행
완화Retpoline, IBRS/IBPBKPTI (커널 페이지 테이블 격리)

분기 예측: 2-bit vs gshare vs Perceptron

항목2-bit 포화 카운터gsharePerceptron
원리4상태 FSMGHR XOR PCML 가중치 학습
복잡도단순중간높음
정확도보통높음 (상관 분기)매우 높음
적용초기 CPU현대 CPU 기본최신 CPU (AMD)