데이터 퀄리티 컨트롤 노하우 1편

#0. 이번 글에서는 본격적으로 데이터 검증하는 노하우에 대해 이야기해보려고 합니다. 데이터 검증 노하우는 크게 4가지가 존재합니다. #1.평균치 암기하기 #2.평균치를 크게 벗어나는 변동이 있었다면 데이터가 틀렸거나 무슨 일이 있거나 #3.변동이 없는 것도 문제 #4.데이터 쪼개기 오류 이번 글에서는 데이터 쪼개기 오류를 제외한 3가지 노하우에 대해 다뤄보도록 하겠습니다. 이것만 알아도 엑셀작업하면서 발생하는 데이터 오류의 90%는 해결 되실 거예요. #1. 평균치 암기하기 숫자뿐 아니라 전혀 모르는 새로운 분야에 빨리 적응하고 싶다면 그 분야의 평균치가 어디에 있는지 파악해야 합니다. 평균치를 알게 되면 지금 내가 어디에 있는지도 알 수 있고 평균을 넘기 위해 무엇에 집중해야 하고 힘을 빼야 하는지 알 수 있으니까요. 평균치를 안다는 건 주로 모니터링하는 숫자의 일 평균, 주 평균, 월평균 데이터를 암기하고 있다는 의미입니다. 평균치를 암기하는 것이 데이터 오류를 점검하는 데 어떻게 도움이 되는지는 이어서 #2에서 설명하도록 하겠습니다. #2. 평균치를 크게 벗어나는 변동이 있었다면 데이터가 틀렸거나 무슨 일이 있었거나 우리가 어떤 숫자를 매일 모니터링하고 있다면 그건 분명히 중요한 성과이거나 성과에 영향력을 행사하는 핵심 지표일 텐데요. 매일 모니터링을 하는 이유는 급격한 변화가 발생했을 때 적절한 대응을 하기 위함입니다. 그런데 평균치를 모른다면 지금 이 숫자가 어떤 시그널을 보내는지 알 턱이 없겠죠? 똑같은 매출 1000만 원도 평균 매출액이 1억인 경우와 900만 원인 경우에 의미하는 바는 다를 테니까요. #3. 어제 숫자와 오늘 숫자는 같을 수 없다 변동이 큰 것만큼 변동이 없는 것도 흔한 오류 중 하나입니다. 어제의 노출수와 오늘의 노출수가 정확하게 같을 수 있을까요? 확률적으로 일어날 수 없는 일인 것은 아니지만 제가 10년 넘게 숫자를 보면서 그랬던 적은 한 번도 없었습니다. 99.99% 확률로 어제 숫자를 잘못 끌고 온 경우입니다.

[시선]데이터 퀄리티 컨트롤 노하우_1편

신사동마케터

[시선]데이터 퀄리티 컨트롤 노하우_1편

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 4월 9일 오후 10:43

 • 

저장 9조회 925

댓글 0

    함께 읽은 게시물


    사람과 데이터

    

    ... 더 보기