핵심 요약
올리브영의 GMS 도입은 Kafka 기반 비동기 Pub/Sub와 지연 재처리로 Out-of-Order 이벤트를 해결하고 물류 처리를 대폭 개선했습니다.
구현 방법
- Kafka MSK 기반 비동기 Pub/Sub 및 Kafka Streams로 지연 감지 및 재처리 흐름 구축
- 지연 재처리용 토픽 확장(tracking-number-internal, stockout-invalidated, stockout-retry)으로 Out-of-Order 대응
- Redis 분산 락과 Two-Phase Commit으로 재고 일관성 확보 및 매입정보 실시간 반영; DataDog/Slack으로 운영 가시성 강화
주요 결과
- Concurrency-safe 할당 및 Bulk Commit으로 처리 속도 대폭 향상
- 주문 1,000건 기준: 할당 280초→40초, 피킹리스트 40초→12초, 피킹라벨 출력 40초→14초
- 운영 안정성 강화 및 Out-of-Order 가능성 감소



