인과관계와 상관관계
brunch
데이터 분석에서도 가장 기초적인 개념이 중요합니다. 특히 설명력이 필요할 수 밖에 없는 도메인에 있을 때 해석에 유의해야 하는 일이 많죠. 현업에서 가장 사고 전환하기 힘든 부분이 인과와 상관의 차이인 것 같습니다. * 상관관계 : X가 증감할 때 Y가 얼마나 증감하는 것을 나타내는 관계. -1과 1 사이의 상관계수를 통해 함께 늘어나는지 오히려 반대로 줄어드는지 설명한다. 보통 0에 가까우면 변수 사이의 관계가 없으며 -1과 1에 가까울수록 상관성이 있다고 말할 수 있다. "까마귀 날자 배 떨어진다"처럼 우연도 해당될 수 있다. * 인과관계 : 먼저 X가 일어날 때 Y가 어떻게 변하는지에 따라 Y에 영향을 주는 X를 설명하는 관계. 관계를 설명할 때 누락된 다른 변수가 없는 상태에서 안정적인 결과가 반복적으로 나타나는 것이 상관성과의 주요 차이이며 회귀식 등 모델을 통해 파악할 수 있다.
2020년 12월 11일 오전 7:20