인과관계와 상관관계 그리고 비지니스 데이터 분석

인과관계와 상관관계라는 것은 참 오묘하다. ​ 1. 당신은 어느날 혼자 길을 걷고 있었다. 적당한 돌멩이가 보이길래 당신은 그냥 세게찼고, 그게 벌집에 맞았고, 벌들이 날아왔고, 당신은 피할 곳이 없었으며 달리기도 그닥 빠르지 못했고, 심지어 벌침에 알러지가 있었으며, 하필이면 사람도 하나 없는 한적한 곳이었으며, 나중에 쓰러져있는 당신을 사람들이 발견했을 때 근처에는 병원도 없었다. ​ 당신이 죽은 원인은 무엇일까? ​ 돌멩이를 찬 것인가? 하필 그게 벌집에 맞은 건가? 평소에 운동을 게을리해 달리기가 빠르지 못했던 점인가? 벌침에 알러지가 있던 점인가? 애초에 사람없는 곳에 걸어다닌 탓인가? ​ 2. 판사가 사형판결을 내렸다. 집행관이 총을 들고, 신호에 맞춰 쐈으며, 당신은 죽었다. ​ 당신이 죽은 원인은 무엇일까? ​ 판사의 사형판결인가? 집행관이 총을 들었기 때문인가? 신호에 맞춰서 쐈기 때문인가? 총알이 맞은 곳이 하필이면 핵심장기를 파손시켰기 때문인가? (팔, 다리에 맞으면 꼭 죽지 않을 수 있으니) 아니면 애초에 재판을 받을 일을 저질렀기 때문인가? 들켰기 때문에? 아니면 처음에 태어난 것 자체가 당신이 죽은 것에 대한 원인인가? ​ 3. "Book of Why" 에 보면 재밌는 예시가 나온다. 초코아이스크림만 시키면 늘 차가 고장이 난다. 알고보니 초코아이스크림은 다른 아이스크림에 비해 유독 만드는 시간이 오래걸렸고... 그래서 공회전으로 오래 대기하면 고장나는 문제가 있던 차는 고장이 나던 것이었다. ​ 당신의 차가 고장이 나는 원인은 무엇일까? ​ 초코아이스크림인가? 오래걸리는 대기시간인가? 아니면 오래 대기하면 고장나는 이상한 상태인 당신의 차 부품상태가 문제인가? 아니면 애초에 초코아이스크림 같은 걸 꼭 고집하는 당신의 자녀가 문제인가? ​ 4. "ISLR" 에 보면 학생과 파산 그리고 신용카드 잔고 예시가 나온다. 학생은 보통 돈이 없으니 신용카드잔고가 높고, 따라서 파산율이 높다. 그래서 신용카드잔고 정보를 알고 있다면 학생이라는 변수는 오히려 파산율을 낮추는 긍정적인 정보다. 근데... 학생은 돈을 버는 상태가 아니니 보통 신용카드잔고가 높을 "이유? 인과?" 가 꽤 있다. ​ 5. 복잡계 이론의 유명한 경구 : "나비의 날갯짓이 지구 반대편에선 태풍을 일으킨다" 나비의 날갯짓은 정말로 태풍의 인과라고 부를 수 있나? ​ --- ​ 어떤게 상관관계고 인과관계인지는 인과관계의 다양한 "층위"로 인해 복잡해진다. "상관관계라는 것이 자주 같이 일어날 뿐 '직접적인' 원인이 아니다" 라고 하지만 과연 어떤 층위로 볼지에 따라 상관관계는 때론 인과관계가 되기도하고 인과관계가 상관관계가 되기도한다. ("모든 자살은 사회적 타살이다") ​ 판사의 사형판결과 사형수의 죽음이 사회법리적 층위에선 "인과관계" 가 있지만... 생체적 관점에서 볼 땐 "총알이 맞은 곳이 하필이면 핵심장기를 파손" 시킨 점이 죽음의 원인일 뿐 판사의 사형판결은 그저... 높은 "상관관계"에 불과하다. (참고로 사형집행이 실패하면 사형을 면제시키는 경우가 있기도하다) ​ https://lnkd.in/grVyhcpm 마치 "학생"이라는 변수가 "신용카드잔고" 라는 변수와 함께 측정되고 있으면 "파산율" 에 대해 반대의 효과를 내면서 기존 "파산율" ~ "학생" 관계가 상관관계일 뿐 인과관계가 아니다 <- 이렇게 해석되는 것처럼 말이다. --- ​ 뭐 결국 주말의 잡상일 뿐이고.. ​ "비지니스 실무 분석가의 입장" 에서는 어떤게 "비지니스 의사결정에 도움이 되는 사업적으로 유의미한" 인과관계인지 파악하는 게 중요할 뿐이다. 상관관계든 인과관계든 그게 중요한 이유는 우리가 행할 의사결정과 그에 따른 행동으로 Impact 가 나올 수 있기 때문임을 잊으면 안된다. 비지니스 실무적으론... 그놈의 초코아이스크림만 안시키면 차가 고장 안날 거고 모든 일이 잘 해결될 수 도 있다는 말이다 ㅋㅋㅋㅋ

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 1월 14일 오전 1:58

댓글 0