Moait
홈인기 피드모든 블로그모든 태그
홈인기 피드모든 블로그모든 태그

실시간 유효 광고 선정을 위한 Flink에서 Apache Paimon 도입기

NAVER D2 faviconNAVER D2·Data·
Apache KafkaApache FlinkApache PaimonApache SparkApache Hive
2025년 07월 31일3

AI 요약

이 글은 AI가 요약했어요. 정확한 내용은 꼭 원문을 확인해 주세요!

핵심 요약

NAVER D2가 Flink와 Apache Paimon을 도입해 실시간 유효 광고를 선별하고 AI Serving의 Feature Store에 반영하는 파이프라인을 구축했습니다.

구현 방법

  • Kafka CDC를 Flink로 수집해 Paimon에 실시간으로 적재
  • 부분 업데이트, 타임 트래블, 조인/집계로 유효 광고 데이터 생성
  • 일별 캠페인 소진량 데이터와 로그를 스트림 조인해 실시간 반영, AI Serving API와의 동기화

주요 결과

  • 실시간으로 유효 광고를 선별해 Feature Store에 업로드하고 조회 가능
  • exactly-once 보장으로 데이터 신뢰성 확보
  • 타임 트래블 및 삭제 벡터 등 고급 기능으로 디버깅·분석 용이

연관 피드

%가 높을수록 이 글과 비슷할 가능성이 높아요!
Apache Flink + RocksDB 튜닝으로 광고 Frequency Capping 실시간 집계를 일주일까지 확장하기 섬네일
76%

Apache Flink + RocksDB 튜닝으로 광고 Frequency Capping 실시간 집계를 일주일까지 확장하기

토스 favicon토스·2026년 04월 16일
Amazon RDS for PostgreSQL에서 테이블 파티셔닝을 통한 시계열 데이터 수집 속도 향상 섬네일
73%

Amazon RDS for PostgreSQL에서 테이블 파티셔닝을 통한 시계열 데이터 수집 속도 향상

AWS faviconAWS·2026년 01월 30일
고객은 절대 기다려주지 않는다: 빠른 데이터 서빙으로 고객 만족도를 수직 상승 시키는 법 섬네일
73%

고객은 절대 기다려주지 않는다: 빠른 데이터 서빙으로 고객 만족도를 수직 상승 시키는 법

토스 favicon토스·2025년 12월 16일