Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

우리는 달에 가기로 했습니다. - Hybrid인프라부터 네트워크 최적화까지, 무신사 AI Infra구축기

무신사 favicon무신사·Architecture·
AWSKubernetesKarpentereBPFGateway API
2025년 12월 15일2

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

무신사는 하이브리드 인프라에서 온프렘 GPU와 AWS를 하나의 클러스터로 운영하고, AutoMode·Hybrid Node와 Self-managed Karpenter를 도입해 비용과 안정성을 대폭 개선한 AI Infra 구축 여정을 공유합니다. 네트워크를 eBPF/Cilium으로 재구성하고 OpenTelemetry로 관측을 통합했으며, Gateway API Inference Extension으로 우선순위 기반 라우팅을 실험했습니다. 결과적으로 최대 95% 비용 절감을 달성했고, 트래픽 급증 시에도 안정성을 추구했습니다.

구현 방법

  • 온프렘 GPU(H100/H200/Blackwell)와 AWS EKS Hybrid Node를 연결해 단일 클러스터 운영
  • 네트워크/데이터 plane를 eBPF/Cilium으로 재설계, kube-proxy 제거, AWS CNI 축소
  • OpenTelemetry 기반 관측 통합과 Gateway API Inference Extension의 우선순위 레이어링 도입

주요 결과

  • 비용 절감 최대 95%
  • 트래픽 급증에서도 안정성 확보를 위한 설계

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
왓챠 추천 서비스 MLOps 적용기 Part1 섬네일
74%

왓챠 추천 서비스 MLOps 적용기 Part1

왓챠 favicon왓챠·2024년 02월 28일
No Image
74%

우리 팀엔 자바스크립트 상차만 하는 프런트엔드가 있었다

우아한형제들 favicon우아한형제들·2025년 11월 20일
AWS Summit Seoul 발표를 꿈꾸는 당신에게(feat. 발표자 후기) 섬네일
71%

AWS Summit Seoul 발표를 꿈꾸는 당신에게(feat. 발표자 후기)

무신사 favicon무신사·2025년 07월 20일