Learning
토픽 119 / 201·데이터 웨어하우스 및 분석

데이터 레이크 (Data Lake)

데이터 레이크 (Data Lake)

원시 데이터를 그대로 저장하는 대용량 저장소

특징: 유연성(↑), 비용 효율(↑), 데이터 늪(Data Swamp) 위험

구성요소: 수집, 저장, 처리, 분석 레이어

기술요소: HDFS, S3, Delta Lake, Parquet

적용사례: 빅데이터 분석, ML 데이터 준비

비교: 데이터레이크(원천/스키마온리드) vs DW(가공/스키마온라이트)

연관: 빅데이터, Hadoop, 데이터 웨어하우스