핵심 요약
타다의 RSS 피드 항목인 비트윈의 HBase 스키마 해부를 통해 HBase 기반 데이터 저장 구조와 구현 기술을 분석합니다.
구현 방법
- Thrift를 이용한 데이터 직렬화 및 저장
- 하나의 Row에 다수 Column을 트리 형태로 구성
- Datastore 래핑 라이브러리로 HBase 접근 추상화
- Haeinsa로 Multi-Row ACID 트랜잭션 적용
- Trigger 기반의 Secondary Index 구현 및 관리와 Column Qualifier 설계를 통한 컬렉션 데이터 연속 저장
주요 결과
- 트랜잭션 무결성 유지와 RPC 비용 최소화에 기여
- Secondary Index 도입으로 다양한 조회 가능
- 데이터를 한 Row에 모아 저장해 Region 관리 및 성능 이점