토픽 129 / 201·빅데이터 및 스트림 처리
Hive / HBase
Hive / HBase
Hadoop 에코시스템의 데이터 처리/저장 기술로, Hive는 SQL 기반 배치 분석, HBase는 NoSQL 기반 실시간 처리를 담당
Hive
- •SQL-on-Hadoop, HiveQL로 MapReduce/Tez/Spark 자동 변환
- •스키마-온-리드(Schema-on-Read), HDFS 기반 저장
- •배치 처리 특화, 실시간 처리 부적합
- •적용: DW, 로그 분석, 대규모 ETL
HBase
- •Column-Family 기반 NoSQL, HDFS 위에 구축
- •실시간 읽기/쓰기, 자동 샤딩(Region), 행 단위 일관성
- •스키마 유연, 수십억 행 × 수백만 컬럼 지원
- •적용: 실시간 조회, 시계열 데이터, 메시징
비교표
연관: Hadoop 에코시스템, HDFS, Spark, NoSQL