토픽 184 / 201·데이터 마이닝 및 분석
데이터 품질 관리 (DQM, Data Quality Management)
데이터 품질 관리 (DQM, Data Quality Management)
데이터의 정확성, 완전성, 일관성, 적시성, 유효성을 지속적으로 관리하여 데이터의 신뢰성을 확보하는 체계적 활동
특징: 데이터 생명주기 전반 관리, 6대 품질 차원, 예방적/사후적 접근
데이터 품질 6대 차원
- •정확성(Accuracy): 실제 값과 일치
- •완전성(Completeness): 필수 데이터 누락 없음
- •일관성(Consistency): 시스템 간 데이터 동일
- •적시성(Timeliness): 필요 시점에 최신 데이터 제공
- •유일성(Uniqueness): 중복 데이터 없음
- •유효성(Validity): 정의된 규칙 준수
DQC (Data Quality Certification): 한국데이터산업진흥원의 데이터 품질 인증 제도, 관리 체계/데이터 값/구조 평가, 1~4등급
관련 활동: 프로파일링(현황 분석), 클렌징(오류 정제), 표준화(형식 통일), MDM(마스터 통합)
비교: DQM(지속적 품질관리/프로세스) vs DQC(인증평가/결과) vs 데이터 거버넌스(전사 정책/체계)
연관: 데이터 거버넌스, 메타데이터, 마스터 데이터, 데이터 표준