[ 나는SOLO로 배우는 베이즈 정리🧡 ] "첫인상 선택을 받았을 때, 최종 커플이 될 확률은?" P( 🧡 | 😘 ) 베이즈 정리(Bayesian Rule)를 쉽게 이해할 수 있도록 제가
[ 나는SOLO로 배우는 베이즈 정리🧡 ] "첫인상 선택을 받았을 때, 최종 커플이 될 확률은?" P( 🧡 | 😘 ) 베이즈 정리(Bayesian Rule)를 쉽게 이해할 수 있도록 제가 즐겨보는 '나는 SOLO'를 통해 설명한 글입니다. 글 소개에 앞서 베이즈 정리에 대해 간단하게 설명을 하면 데이터라는 조건이 주어졌을 때 조건부 확률을 구하는 공식을 베이즈 정리라고 하며, 사전에 주어진 확률을 통해서 사후 확률을 구하여 정확도를 높여가는 과정이라고 할 수 있습니다. 🎲 주사위 예제 쉬운 예로 주사위 던지기 확률을 살펴보면 주사위를 던질 때 3이 나오는 사건의 확률은 1/6입니다. 그러면 주사위를 던질 때 홀수가 나올 확률은 모두가 잘 알듯이 3/6이 됩니다. 그리고 이 두 가지 사건을 모두 만족하는 확률은 숫자 3이 나오는 확률이므로 1/6이 됩니다. 만약, 주사위 숫자가 홀수가 나왔다는 가정하에 숫자 3이 나오는 사건의 확률은 어떻게 될까요? 아마 모두 쉽게 1/3이라고 대답할 수 있습니다. 바로 이것이 조건부 확률로 홀수라는 숫자가 나왔다는 가정하에 숫자 3이 나올 확률을 구하는 것을 의미합니다. 그리고 베이즈 정리는 이러한 두 사건 A, B가 주어졌을 때, 조건부 확률과 각 확률을 가지고 순서가 뒤바뀐 조건부 확률을 쉽게 구할 수 있는 공식이라고 할 수 있습니다. 👩❤️👨 나는 SOLO 1기부터 6기까지 데이터로 살펴본 베이즈 정리 주사위 예제로 베이즈 정리에 대한 감이 잡히셨다면 '나는SOLO'에서 첫인상 선택을 받았을 때, 최종 커플이 될 확률을 구해보도록 하겠습니다. 사전 정보가 담긴 데이터는 나는SOLO 1기부터 6기까지의 데이터를 기준으로 하였습니다. 여기에서 첫인상 선택은 남성 출연자의 선택을 기준으로 하였습니다. 참고한 데이터를 간단하게 설명하면 1기부터 6기까지의 남성 출연자는 총 38명이었습니다. 따라서, 첫인상 선택은 총 38번이 이루어졌습니다. 여기에서 한 가지 재미있는 사실이 있는데, 나는SOLO 1기부터 6기까지 총 4커플이 실제 결혼까지 이루어졌습니다. 그런데 결혼한 4커플은 모두 남성 출연자가 상대 여성 출연자를 첫인상 선택의 상대로 택하였습니다. 참고로 1기의 영철❤️영숙 커플의 경우 영철의 첫인상 선택은 영숙이었지만 최종 커플은 정순과 되었고, 실제 결혼은 다시 영숙과 하였습니다.😵💫 이제 정리된 데이터를 통해 얻은 정보와 몇 가지의 가정을 가지고 우리가 궁금해하는 확률을 구해보도록 하겠습니다. 1️⃣ 나는SOLO에서 다음의 두 가지 사건을 가정함 사건 A. 최종 커플 매칭 → P(🧡) = P(A) 사건 B. 첫인상 선택을 받았다. → P(😘) = P(B) 2️⃣ 여성 출연자는 최종 커플이 될 확률을 50 대 50으로 가정한다 남성에게 첫인상 선택을 받았지만 실제 남성의 마음에 대한 아무런 정보가 없기 때문에 두 상황에 대한 확률을 동등하게 생각한다. 이를 "이유불충분의 원리(Principle of Indifference)"라고 하며, 이렇게 설정된 확률을 사전 확률(prior probability)라고 한다. 3️⃣ 1기부터 6기까지의 데이터로 얻은 정보 최종 커플이 되었을 때, 첫인상 선택을 받았을 확률 → P(😘|🧡) = P(B|A) = 0.54 최종 커플이 되지 않았을 때, 첫인상 선택을 받았을 확률 → P(😘|💔) = P(B|Ac) = 0.34 *Ac = A의 여집합을 의미 위에서 주어진 정보를 통해서 아래의 두 가지를 유추할 수 있습니다. 최종 커플이 되었지만, 첫인상 선택을 받지 않았을 확률 → P(😭|🧡) = P(Bc|A) = 0.46 최종 커플이 되지 않았고, 첫인상 선택도 받지 못했을 확률 → P(😭|💔) = P(Bc|Ac) = 0.66 베이즈 정리 공식을 이용해 P(첫인상 선택을 받았을 때, 최종 커플이 될 확률) = P(🧡|😘) = P(A|B)를 구하겠습니다. 베이즈 정리 공식에 의해 P(A|B) = P(B|A) * P(A) / P(B) = P(😘|🧡) * P(🧡) / P(😘) 로 정리할 수 있습니다. 이미 사전 정보로 P(😘|🧡)을 알고 있습니다. 그리고 P(😘)에 해당하는 확률은 최종 커플이 되고 첫인상 선택까지 받은 확률과 최종 커플이 되지 않았지만 첫인상 선택을 받은 확률을 더하여 구할 수 있습니다. 그리고 P(🧡)는 여성 출연자가 사전에 설정한 사전 확률 0.5를 이용합니다. 이렇게 구한 확률은 아래와 같습니다. P(A|B) = P(B|A) * P(A) / P(B) = P(😘|🧡) * P(🧡) / P(😘) = (0.54 * 0.5) / 0.44 = 0.61 베이즈 정리로 구한 첫인상 선택을 받았을 때, 최종 커플이 될 사후 확률은 0.61로 사전 확률로 설정한 0.5보다 0.11 높은 것을 알 수 있습니다. 사실 확률이 61%로 나오긴 했지만 여기에는 한 가지 문제가 있습니다. 바로 사랑과 연애는 일방향이 아닌 쌍방향이기 때문에 남성의 첫인상 선택이라는 일방향의 조건으로만 구한 사후 확률에 대해 의아함을 가질 수 있습니다. 하지만 설명을 쉽게 하기 위해 남성 출연자의 첫인상 선택이라는 확률만 이용하였고, 실제로 남성과 여성의 각 첫인상 선택 데이터를 활용하면 조금 더 신뢰할 수 있는 사후 확률을 구할 수 있습니다. 수식으로 설명은 드렸으나, 더 직관적이고 이해하기 쉬운 방법이 있습니다. 이 부분은 아래의 링크를 참고하시면 확인할 수 있습니다.😄 📊 데이터가 많아질수록 강력한 베이즈 정리 베이즈 이론은 빈도주의 통계와 달리 사전 확률을 이용한다는 특징이 있습니다. 이러한 특징 때문에 빈도주의 통계를 지지하는 쪽에선 도출된 결과를 신뢰할 수 없다는 비판이 있으나, 베이즈 이론은 데이터가 많아질수록 더 객관적인 결과로 나아갑니다. 예를 들어, '나는 SOLO'에서 남성의 첫인상 선택으로 최종 커플을 예측하라고 한다면 쉽지 않습니다. 그러나 첫인상 선택 이후 각 출연자들을 통해 일어난 사건을 종합하여 시청자는 최종 커플에 대한 예측력을 높일 수 있습니다. 보통 '나는 SOLO'에서는 첫인상 선택, 출연자의 자기 소개와 몇 차례 데이트 기회 그리고 중간 중간에 출연자 간에 소통 (🥲 "옥순씨 잠깐 이야기 할 수 있을까요?") 등의 행동을 통해 우리의 사전 확률을 지속적으로 업데이트 하여 최종 커플에 대한 확률의 객관성을 높입니다. 바로 이것이 베이즈 정리의 중요한 통찰이라고 할 수 있습니다. 실제로 베이즈 이론은 사람의 의사결정 방식과 유사합니다. 그리고 경영학에서 'Lean 방식'이라고 불리는 접근과도 닮아 있습니다. 이러한 이유 때문에 최근 베이즈 정리가 인공지능의 의사결정에 매우 강력한 도구로써 위력을 발휘하기도 합니다. 이 글은 Youtube 채널 '위니버스'의 '베이즈 정리를 이해하는 가장 쉬운 방법'에서 영감을 받아 작성하였습니다. 해당 유튜브 채널의 영상을 보시면 베이즈 정리에 대한 개념을 더 쉽게 이해하실 수 있습니다.👍