핵심 요약
네이버 플레이스 개발 팀은 MinIO를 분산 S3형 스토리지로 구성해 HA/DR를 검증하고, HDFS 백업과 DistCP 기반 복구를 Airflow로 자동화했습니다.
구현 방법
- 4대 서버 Distributed MinIO 구성에 Cephrbd PVC 마운트
- Erasure Coding으로 데이터 손실 대비
- HDFS로 백업, DistCP 기반 복구를 Airflow Dag로 자동화
- IDC 이중화 및 mc-admin heal를 통한 Failover 검증
주요 결과
- 읽기 가능: 2대 장애 시 읽기 가능, 쓰기 불가
- 3대 이상 장애 시 읽기/쓰기 중단, 복구 위한 RTO 약 3일
- RPO 최악 7일로 설정, 초기 백업 약 51시간, 증분 백업으로 매일 가능
- Failover 검증 성공 및 자동 데이터 복구 지원



