Learning
토픽 218 / 224·비교표

데이터 웨어하우스 및 분석

OLTP vs OLAP

항목OLTPOLAP
목적운영(트랜잭션 처리)분석(의사결정 지원)
데이터정규화(현재 데이터)역정규화(이력 데이터)
쿼리단순, 행 단위복잡, 집계/분석
응답시간밀리초초~분
적합주문처리, 결제매출분석, 리포팅

스타 스키마 vs 스노우플레이크 스키마

항목스타 스키마스노우플레이크 스키마
디멘션 정규화비정규화정규화
구조단순(조인 최소)복잡(조인 증가)
저장공간중복으로 증가효율적
쿼리 성능빠름조인으로 느릴 수 있음

ETL vs ELT

항목ETLELT
변환 위치변환 후 적재적재 후 변환
처리 엔진외부 ETL 도구타겟 시스템(DW)
적합전통적 DW클라우드 DW
대표 도구Informatica, DataStagedbt, BigQuery

데이터레이크 vs DW

항목데이터 레이크DW(데이터 웨어하우스)
데이터 형태원천(Raw) 데이터가공된 데이터
스키마Schema-on-ReadSchema-on-Write
용도빅데이터 분석, MLBI, 리포팅
저장 기술HDFS, S3, Delta LakeRDBMS, 컬럼 저장소

DW vs 데이터마트

항목DW데이터마트
범위전사 통합부서/주제별
규모대규모소규모
구축장기, 고비용단기, 저비용

SCD Type 1 vs Type 2 vs Type 3

항목Type 1(덮어쓰기)Type 2(이력 보존)Type 3(이전값 보관)
변경 처리최신값 덮어쓰기새 행 추가(이력)이전값 컬럼 추가
이력미보존전체 이력 보존직전 값만
저장공간최소증가중간

MOLAP vs ROLAP vs HOLAP

항목MOLAPROLAPHOLAP
저장메모리(다차원 배열)RDBMS(SQL)혼합
성능매우 빠름SQL 의존중간
확장성제한적높음중간

CDC vs ETL

항목CDCETL
처리 방식실시간(변경분만)배치(전체/주기적)
부하적음높음(전체 추출)
지연실시간주기적 지연
대표 도구Debezium, GoldenGateInformatica, Talend