핵심 요약
여기어때가 OpenTelemetry와 Kafka를 활용해 안정적인 Observability 아키텍처를 구축했습니다.
구현 방법
- OpenTelemetry Auto-Instrumentation과 Kubernetes Operator로 SDK 주입 및 계측 설정 자동화
- Gateway Collector로 데이터 정제 및 정책을 중앙 관리하고, Kafka로 백엔드로 송출
- 토픽별 Signal 분리: Traces용 Tempo, Metrics용 Mimir, Logs용 Loki로 저장하고 Grafana LGTM으로 시각화
- 로그 수집 예시에서 memory_limiter, 배치/전송 안정성 강화 설정 반영
- Kafka 데이터 유실 방지 및 트래픽 급증 대응을 위해 Kafka에 수집 후 브로커를 통해 처리, KEDA를 통한 Lag 기반 자동 확장
주요 결과
- 데이터 유실 방지 및 대용량 트래픽에 대한 완충 역할
- 생산자-소비자 분리로 아키텍처 확장성과 장애 격리 개선
- 표준화된 Observability 파이프라인으로 벤더 종속성 없이 유연한 운영 가능

