[화해의 데이터 웨어하우스 구축 사례]
도입배경: 기간별 통계성 데이터, 리텐션 등 복잡한 데이터 지표 추출 시 많은 시간 소요(+운영 DB 부하 야기)
1단계: 데이터 레이크 구축(AWS Redshift)
👉원천 데이터와 거의 동일, 운영 DB 부하 문제는 해결되었으나 데이터 추출 방식은 기존과 동일
2단계: 데이터 웨어하우스 구축 (+데이터 카탈로그 구축)
👉주제 영역별 fact 테이블 설계, 공통 디멘션과 메트릭 정의(단, 조인 최소화를 위해 최대한 반정규화)
👉복잡한 쿼리 단순화 / 지표 측정 기준 일원화 가능!!
3단계: 데이터 웨어하우스 디벨롭 (+데이터 리터러시 확장)
👉실제 분석에 집중할 수 있도록, 모두가 데이터에 쉽게 접근할 수 있도록