토픽 119 / 201·데이터 웨어하우스 및 분석
데이터 레이크 (Data Lake)
데이터 레이크 (Data Lake)
원시 데이터를 그대로 저장하는 대용량 저장소
특징: 유연성(↑), 비용 효율(↑), 데이터 늪(Data Swamp) 위험
구성요소: 수집, 저장, 처리, 분석 레이어
기술요소: HDFS, S3, Delta Lake, Parquet
적용사례: 빅데이터 분석, ML 데이터 준비
비교: 데이터레이크(원천/스키마온리드) vs DW(가공/스키마온라이트)
연관: 빅데이터, Hadoop, 데이터 웨어하우스