Learning
토픽 128 / 201·빅데이터 및 스트림 처리

Hadoop 에코시스템

Hadoop 에코시스템

분산 저장 및 처리를 위한 오픈소스 프레임워크

특징: 수평 확장(↑), 비용 효율(↑), 실시간 처리(↓)

구성요소: HDFS, MapReduce, YARN

기술요소: Hive, Pig, HBase, Spark

적용사례: 대용량 배치 처리, 로그 분석

비교: Hadoop(배치) vs Spark(인메모리)

연관: 빅데이터, HDFS, MapReduce