Learning
토픽 41 / 111·메모리 계층 (Memory Hierarchy)

ECC 메모리 (Error Correcting Code Memory)

ECC 메모리 (Error Correcting Code Memory)

메모리 셀의 비트 오류를 자동으로 감지하고 정정하는 기능이 내장된 메모리로, 서버/데이터센터 환경에서 데이터 무결성을 보장

오류 유형: 소프트 에러(우주선/알파 입자에 의한 일시적 비트 반전), 하드 에러(물리적 결함에 의한 영구적 오류)

SEC-DED: Single Error Correction, Double Error Detection. 해밍 코드 기반으로 1비트 오류 자동 정정, 2비트 오류 감지

Chipkill: 메모리 칩 하나가 완전히 고장나도 데이터를 복구하는 기술. IBM 개발, 서버급 필수. RAID와 유사한 개념을 메모리에 적용

동작원리: 데이터 기록 시 ECC 코드(체크비트) 생성→저장, 읽기 시 ECC 코드 검증→오류 감지→정정

비교: 일반 메모리(검증 없음/저비용) vs Parity 메모리(1비트 감지만/정정 불가) vs ECC(1비트 정정+2비트 감지) vs Chipkill(칩 장애 복구)

적용사례: 서버, 데이터센터, 금융 시스템, HPC, 항공우주, 의료장비

연관: 해밍 코드, 메모리 신뢰성, 서버 아키텍처, RAID, 데이터 무결성