당근 데이터 디스커버리 구축기: DataHub와 DataWiki로 여는 데이터 탐색의 첫걸음
Medium
안녕하세요, 당근 데이터 가치화 팀의 Software Engineer 다니엘레예요.
"가설 검증을 위해선 어떤 데이터를 봐야 할까?", "해당 데이터를 어디서 찾아볼 수 있을까?" 데이터 기반의 의사결정을 시작하려면, 이런 질문들을 늘 마주하게 되죠. 기민한 의사결정을 위해서는 필요한 데이터를 쉽고 빠르게 찾을 수 있어야 해요. 데이터는 충분히 쌓고 있지만 정작 어떤 데이터가 존재하는지, 이 데이터가 정확히 무엇을 의미하는지, 누가 관리하며 언제 마지막으로 업데이트한 건지 등을 알기 어려운 경우가 종종 있어요.
아무리 좋은 데이터가 있어도 찾을 수 없다면 무용지물이에요. 찾아도 데이터의 의미를 정확히 파악하지 못한다면 잘못된 의사결정으로 이어질 수도 있죠. 이런 상황들이 반복될수록 분석 업무의 효율성이 떨어질 뿐 아니라, 데이터에 대한 신뢰마저 흔들리게 돼요. 따라서 조직 내에서 구성원들이 데이터를 쉽게 찾고, 이해하고, 신뢰할 수 있도록 지원하는 과정인 데이터 디스커버리는 매우 중요해요.
데이터 가치화 팀이 정의한 데이터 디스커버리를 확보하는 데 필요한 기능은 크게 다음 세 가지예요.
1. 메타 데이터 정보의 수집이 쉽고 지속적으로 최신 상태를 유지할 수 있어야 한다.
2. 입력된 메타 데이터 정보의 저장 및 관리가 잘 돼야 한다.
3. 저장된 메타 데이터 정보를 잘 탐색할 수 있어야 한다.
DataHub와 Datawiki를 활용해 데이터 탐색 인프라를 구축한 과정이 궁금하다면
지금 당근 테크 블로그에서 글 전문을 읽어보세요!🥕
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 7월 17일 오전 6:11
두 카페가 있다. 두 카페 모두 점원이 주문을 받고 커피를 내리는 카페였다. 그런데, 어느 날 한 카페에서 키오스크를 도입했다. 그렇다면, 여전히 점원이 주문을 받는 카페보다 키오스크를 도입한 카페가 변화에 더 기민하게 대응하는 것일까? 그럴 수도 있고, 그렇지 않을 수도 있다. 변화에 기민하게 대응한다는 건, 변화를 빨리 도입한다는 것과는 다른 이야기이기 때문이다.
... 더 보기