핵심 요약
SK플래닛은 Spot by NetApp를 AWS EKS에 적용해 운영 비용을 약 40% 절감하고 SLA를 유지하는 구성과 모니터링 전략을 공유합니다.
주요 경험
- 파드 생성/종료 시 startupProbe와 preStop를 활용해 트래픽을 중단 없이 처리
- PDB, podAntiAffinity, topologySpreadConstraints, Descheduler 등으로 노드 교체 시 서비스 가용성 확보
- Headroom 설정으로 노드 교체 중에도 빠르게 파드를 배치하고 대기 시간 최소화
- 다양한 인스턴스 타입 구성과 On-Demand 대체 전략으로 비용 최적화 효과 극대화
- nGrinder를 이용한 부하테스트로 교체 시 트래픽 에러 없이 안정성 검증
- 전환은 약 6주 소요되었고 설정과 모니터링을 순차적으로 진행
얻은 인사이트
- 모니터링 기반 인스턴스 최적화가 비용 절감의 핵심임을 확인
- Spot의 종료 예측에 맞춘 롤링 업데이트 및 PDB 중심의 안정성 설계의 중요성
- 다양한 인스턴스 타입 구성과 Headroom 조합이 고가용성 및 예측 가능한 비용에 기여
