Learning
토픽 48 / 107·클라우드 전략과 마이그레이션

오토스케일링

오토스케일링

시스템 부하 메트릭에 따라 컴퓨팅 자원을 자동으로 확장(Scale Out)하거나 축소(Scale In)하여 성능과 비용을 최적화하는 클라우드 핵심 기능

특징: 메트릭 기반 자동 조정, 최소/최대/원하는 용량 설정, 쿨다운 기간(연속 스케일링 방지), 예측 스케일링(ML 기반)

수평 확장 vs 수직 확장

정책 유형 상세

  • 대상 추적(Target Tracking): 목표 메트릭값 설정(예: CPU 70%), ASG가 자동 조절. 가장 간편하고 권장되는 방식
  • 단계별(Step Scaling): 메트릭 범위별 차등 조치(예: CPU 70%→+1, 85%→+3). 세밀한 제어 가능
  • 예약(Scheduled): 시간 기반 예약(예: 매일 09시 Scale Out, 22시 Scale In). 패턴이 예측 가능한 워크로드에 적합
  • 예측(Predictive): ML 기반으로 과거 패턴 분석하여 사전 스케일링. 주기적 트래픽 패턴에 효과적, Cold Start 방지

구성요소: 메트릭(CPU/메모리/네트워크/사용자 정의/SQS 큐 길이), 정책(대상 추적/단계별/예약/예측), 스케일 인/아웃(인스턴스 수 증감), 헬스 체크(비정상 인스턴스 교체), 쿨다운(기본 300초, 연속 스케일링 방지)

주요 서비스: AWS Auto Scaling(EC2/ECS/DynamoDB), HPA(K8s Horizontal Pod Autoscaler: Pod 수 조정, CPU/메모리/Custom 메트릭), VPA(Vertical Pod Autoscaler: Pod 리소스 요청/제한 자동 조정), KEDA(이벤트 기반 K8s 오토스케일링, 외부 메트릭 연동)

적용사례: 웹 트래픽 급증 대응, 야간/주말 축소로 비용 절감, 배치 처리 확장

비교: 수평 확장(Scale Out/인스턴스 수 증가/무한 확장/Stateless 적합) vs 수직 확장(Scale Up/인스턴스 크기 증가/한계 있음/다운타임 가능)

연관: 로드밸런싱, 컨테이너, 비용 최적화, 탄력성