Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그
토스증권 Iceberg 적용기 #1: CDC 환경은 왜 제대로 동작하지 않을까? 섬네일

토스증권 Iceberg 적용기 #1: CDC 환경은 왜 제대로 동작하지 않을까?

토스 favicon토스·Data·
Apache IcebergCDCPosition DeleteEquality DeleteDeletion Vector
2025년 09월 10일3

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약
토스증권은 Iceberg CDC 도입으로 같은 커밋 내 Update/Delete를 Position Delete로 처리해 데이터 중복 없이 정합성을 확보했습니다.

구현 방법

  • Update 전략(COW/MOR)과 Delete 방식(Position Delete, Equality Delete) 적용
  • Commit 단위로 Data/File/Delete File 생성 및 Deletion Vector 활용
  • Iceberg Sink Connector(Kafka Connect)로 병렬 Writes, Coordinator의 원자적 Commit 보장
  • Kafka Key를 id로 고정해 같은 Partition으로 이벤트 순서 보장

주요 결과

  • 같은 커밋 내 Row 삭제를 정확히 반영해 중복 감소
  • Commit Timeout/Schema Evolution 상황에서도 정합성 유지
  • 준실시간 CDC 운영 가능 및 확장성 확보

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
리멤버앤컴퍼니의 Amazon S3 Tables를 활용한 실시간 분석 워크로드 구축하기 1부: S3 Tables에 CDC 데이터 레이크 구축하기 섬네일
71%

리멤버앤컴퍼니의 Amazon S3 Tables를 활용한 실시간 분석 워크로드 구축하기 1부: S3 Tables에 CDC 데이터 레이크 구축하기

AWS faviconAWS·2025년 10월 29일
No Image
68%

하나의 데이터, 멀티 엔진: Apache Iceberg로 구축하는 데이터레이크

여기어때 favicon여기어때·2025년 12월 16일
No Image
67%

매번 다 퍼올 필요 없잖아? 당근의 MongoDB CDC 구축기

당근 favicon당근·2025년 12월 08일