Learning
토픽 1 / 172·통계/수학 기초

기술통계 (Descriptive Statistics)

기술통계 (Descriptive Statistics)

수집된 데이터의 특성을 요약·정리하여 표, 그래프, 수치 지표로 기술하는 통계 분야로, 데이터의 중심경향, 산포도, 분포 형태를 파악하는 데이터 분석의 첫 단계

특징: 데이터 요약(전체 파악), 시각화 가능, 추론 없이 기술만, 탐색적 분석 기반

중심경향 측도

  • 평균(Mean): 산술 평균 Σx/n, 이상치에 민감
  • 중앙값(Median): 정렬 후 가운데 값, 이상치에 강건
  • 최빈값(Mode): 가장 빈번한 값, 범주형 데이터에 적합

산포도 측도

  • 분산(Variance): 편차 제곱의 평균, σ² = Σ(x-μ)²/N
  • 표준편차(SD): 분산의 제곱근, 원래 단위로 해석
  • 범위(Range): 최대-최소, 이상치에 민감
  • IQR(사분위범위): Q3-Q1, 이상치 탐지(1.5×IQR 룰)
  • 변동계수(CV): SD/Mean × 100%, 단위 다른 데이터 비교

분포 형태

  • 왜도(Skewness): 좌우 비대칭, 양(+)=오른꼬리, 음(-)=왼꼬리, 0=대칭
  • 첨도(Kurtosis): 뾰족함, 양(+)=뾰족(Leptokurtic), 음(-)=평평(Platykurtic)

시각화: 히스토그램, 박스플롯, 산점도, 바차트, 파이차트

비교: 기술통계(데이터 요약/추론없음) vs 추론통계(모집단 추론/가설검정)

연관: 확률분포, 가설검정, 탐색적 데이터 분석(EDA)