Community

퍼블리 읽어주는 청년 181 만남이 있으면 떠나감이 있는 것 관계에서 영원히 변하지 않는 것은 없다고 생각합니다. 다양한 이유가 있겠지만 마음이 변하는 것이 가장 큰 이유입니다. 그만큼 마음을 지

퍼블리 읽어주는 청년 181 만남이 있으면 떠나감이 있는 것 관계에서 영원히 변하지 않는 것은 없다고 생각합니다. 다양한 이유가 있겠지만 마음이 변하는 것이 가장 큰 이유입니다. 그만큼 마음을 지키는 일은 매우 어렵습니다. 가정과 직장, 친구 등 모든 관계가 그렇습니다. 물리적인 이해관계가 없는 상황에서도 마음이 변하는데 돈이 오고 가는 비즈니스 관계는 더 빠르게 변할 것 같습니다. 오늘은 기업이 제공하는 제품 또는 서비스를 떠나는 고객을 예측하는 방법을 공유합니다. 영화 마이너리티리포트가 생각나네요. 이제 머신러닝도 어렵지 않게 오픈 소스를 활용할 수 있다고 하니 참 세상 좋아졌습니다 :) 떠날 고객이 보내는 신호, 답은 데이터에 있다 저자 조영민 고객당 복수의 서비스가 필요 없고, 정해진 파이 안에서 경쟁을 통해 비즈니스를 유지하는 산업의 경우에는 사실상 이탈 예측이 의미를 갖기 어렵습니다. 예컨대 국내 인터넷·이동통신 서비스에서 이러한 특징이 명확하게 나타납니다. 고객 이탈 예측을 효과적으로 활용할 수 있는 제품에는 다음의 특징이 있습니다. 주기적으로 충실하게 활용하는 고객의 비중이 높아야 합니다. 비록 경쟁사가 많은 레드오션일지라도 소비자가 자유롭게 A 제품과 B 제품을 오갈 수 있다면 이탈 예측이 유효합니다. 게임이나 이커머스 같은 제품이 그렇습니다. 배틀 그라운드와 오버 워치, 네이버 쇼핑과 쿠팡의 사례를 예로 들 수 있습니다. 서비스의 현재 상황과 비즈니스 환경에 맞게끔 고객 이탈을 정의합니다. 위의 세 가지 정의를 참조하실 수 있습니다. 결정된 기준을 적용해 DB에서 이탈 고객의 데이터를 추출하기 시작합니다. 이탈 고객 한 명 한 명의 데모그래픽*과 구매 이력, 서비스 사용량, 빌링 데이터**, 마케팅 수집 데이터 등 수집 가능한 데이터를 확보합니다. 사용 패턴은 서비스마다 다르겠지만, 공통적으로 이탈 전의 고객들은 평상시와 다른 사용 패턴을 보이기 마련입니다. 평균값보다 이용 시간이 줄어든다든가, 로그인 주기가 길어진다든가, 구매액이 급히 감소한다든가 하는 식의 패턴입니다. 복잡한 코딩 과정 없이 머신 러닝을 통해 예측 모델을 만들 수 있는 오렌지(Orange)라는 오픈 소스 도구를 활용하려고 합니다. 오픈 소스인 만큼 구글링을 통해 궁금한 것을 찾기도 쉽고 친절하게 강의해 주시는 분들도 많이 있습니다. 1만 명가량의 고객 데이터를 대상으로 분석한다고 했을 때, 최소한 30% 이상의 이탈 고객들의 데이터를 확보해서 데이터셋을 만들어야 어느 정도 성능을 담보할 수 있습니다. 일반 고객의 비중이 70%를 초과하면 예측 모델을 만들기가 어렵습니다. 이것을 임밸런스(imbalance, 불균형) 문제라고 합니다. 잔류와 이탈을 100%에 가깝게 예측할 수 있으면 좋겠지만, 현실적으로는 어려운 일입니다. 머신 러닝은 이탈 고객이 보이는 특정 변수의 유사 패턴을 통해 사용자의 이탈 여부를 예측할 뿐, 고객 개개인의 모든 변수를 고려할 수 없기 때문입니다.

알림

알림이 없습니다