Learning
토픽 2 / 172·통계/수학 기초

확률과 확률분포 (Probability & Distributions)

확률과 확률분포 (Probability & Distributions)

불확실한 사건의 발생 가능성을 수학적으로 정량화하는 이론으로, 확률변수의 값과 그 발생 확률의 대응 관계를 나타내는 확률분포를 통해 통계적 추론의 기반 제공

특징: 수학적 엄밀성, 모델링 기반, 추론 통계의 전제, 실험 설계 근거

확률 기초

  • 확률 공리: 0 ≤ P(A) ≤ 1, P(Ω) = 1, 상호배타적이면 P(A∪B) = P(A)+P(B)
  • 조건부 확률: P(A|B) = P(A∩B)/P(B)
  • 베이즈 정리: P(A|B) = P(B|A)×P(A)/P(B)
  • 독립: P(A∩B) = P(A)×P(B)

이산 확률분포

  • 이항분포(Binomial): n회 시행 k번 성공, B(n,p), 평균 np, 분산 np(1-p)
  • 포아송분포(Poisson): 단위 시간/공간 사건 수, P(λ), 평균=분산=λ
  • 기하분포: 첫 성공까지 시행 수

연속 확률분포

  • 정규분포(Normal): N(μ,σ²), 종형 곡선, 68-95-99.7 법칙
  • 표준정규분포: Z = (X-μ)/σ, N(0,1)
  • t분포: 소표본(n<30), 자유도에 따라 형태 변화, 정규보다 꼬리 두꺼움
  • χ²분포: 적합도/독립성 검정, 자유도 k, 평균 k
  • F분포: 두 분산 비, 분산분석(ANOVA)에 사용
  • 균일분포(Uniform): U(a,b), 모든 값 동일 확률
  • 지수분포(Exponential): 사건 간 대기 시간, 포아송의 연속 대응

비교: 이산(정수값/이항·포아송) vs 연속(실수값/정규·t·χ²·F)

연관: 가설검정, 신뢰구간, 베이지안 통계, 중심극한정리