토픽 7 / 172·통계/수학 기초
상관분석 (Correlation Analysis)
상관분석 (Correlation Analysis)
두 변수 간의 선형적 관계 방향과 강도를 상관계수로 측정하는 통계 기법으로, 변수 간 연관성을 파악하되 인과관계를 증명하지는 않음
특징: 관계 강도·방향 측정, 인과관계 ≠ 상관관계, -1 ~ +1 범위
상관계수 종류
- •피어슨(Pearson r): 연속형 변수, 선형관계, 정규성 가정
- •스피어만(Spearman ρ): 순위 기반, 비선형/비정규에 강건
- •켄달(Kendall τ): 순위 일치도, 소표본에 적합
해석 기준: |r| < 0.3(약), 0.3~0.7(중), > 0.7(강), ±부호(방향)
주의사항
- •상관≠인과: 공변량 없이 인과 단정 금지
- •허위상관(Spurious): 제3변수 효과로 나타나는 거짓 상관
- •비선형 관계: 피어슨으로 측정 불가, 산점도 확인 필수
비교: 피어슨(선형/연속) vs 스피어만(순위/비선형) vs 회귀(예측/인과)
연관: 회귀분석, 산점도, 공분산, 다중공선성