Community

데이터 분석을 하다보면 잘못된 해석으로 인해 엉뚱한 결론을 도출하는 경우가 종종 있습니다. 이 글은 우리가 하기 쉬운 3가지 실수를 몇 가지 실제 사례를 통해 소개하고 있습니다. 1) Simpso

데이터 분석을 하다보면 잘못된 해석으로 인해 엉뚱한 결론을 도출하는 경우가 종종 있습니다. 이 글은 우리가 하기 쉬운 3가지 실수를 몇 가지 실제 사례를 통해 소개하고 있습니다. 1) Simpson's paradox: 전체 집단에 대한 통계량이 세부 집단으로 나눠서 구한 통계량과 서로 반대되는 결론을 도출하는 현상을 말합니다. 이 글에서 소개하는 버클리 대학의 남성과 여성의 전체 입학률 차이와 학과별 입학률 차이가 서로 반대의 결과가 나온 현상이 대표적인 사례입니다. 2) 상관 관계를 인과 관계로 해석하는 오류: 이 역시 흔히 하는 실수입니다. 관측된 상관 관계가 실제 인과 관계인지를 확인하려면 면밀한 분석이 필요하고 이런 작업을 '인과 추론 분석' 이라고 부르죠. 3) 잘못된 조건부 확률 추정: 특정 상황이 발생할 확률이 얼마나 되는지를 추정할 때 조건부 확률을 제대로 계산하지 못하면 잘못된 결론에 이를 수 있습니다. 이 글에서는 이로 인해 연쇄 유아 살인범으로 복역한 한 사례를 소개하고 있습니다.

알림

알림이 없습니다