Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

매번 다 퍼올 필요 없잖아? 당근의 MongoDB CDC 구축기

당근 favicon당근·Data·
Apache FlinkMongoDBApache SparkBigQueryChange Data Capture
2025년 12월 08일6

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

당근은 MongoDB Change Stream 기반의 CDC 파이프라인을 Flink CDC로 구축하고 Initial Full Dump를 Spark로 처리해 Two-Stage Table로 스키마를 관리하며 2시간 SLO를 안정적으로 달성하고 부하를 낮췄다.

구현 방법

  • Change Stream을 Flink CDC로 구독하고 updateLookup으로 fullDocument를 유지해 트랜잭션 순서를 보장
  • Initial Dump는 Spark로 처리 후 CDC로 증분 반영
  • 배치 파이프라인은 Schema Evolution, Extract CUD Latest, Merge to Raw, Materialize to Final의 4단계로 운영
  • Two-Stage Table: Stage1 Raw JSON, Stage2 Final; 스키마 변화에 지연 없이 반영

주요 결과

  • 2시간 SLO를 충족했고 Stage2 반영은 20분 이내 달성
  • 정합성 검증을 2주간 유지하며 안정성 확보
  • 운영 부하 감소와 파이프라인 신뢰도 향상

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
No Image
79%

6개월 만에 연간 수십조를 처리하는 DB CDC 복제 도구 무중단/무장애 교체하기

NAVER D2 faviconNAVER D2·2025년 11월 18일
No Image
77%

Karrot’s Journey to CDC with MongoDB

당근 favicon당근·2025년 12월 09일
무신사 쿠폰 시스템, DB 성능 64% 개선으로 기술 부채를 갚다 섬네일
75%

무신사 쿠폰 시스템, DB 성능 64% 개선으로 기술 부채를 갚다

무신사 favicon무신사·2025년 07월 27일