쿠팡이 적자를 감수하고 무엇을 모으고 있다고 생각하는가? 어느 때부턴가 쿠팡은 '쿠팡은 싸고 빨라요'라는 메시지 대신 소비자가 즉시 구매할 확률이 높은 상품을 바로 보여주기 시작했다. 즉, 쿠팡은 바로 살만한 상품을 소비자에게 제시하기 위해 구매 데이터를 모으고 있다. 기업들은 데이터 3법이 통과되고 분주해졌다. 가장 많은 데이터를 가진 기업도 스스로의 데이터만으로는 수익을 창출하기 어렵다는 한계를 느꼈고, 이제는 어떤 데이터와 결합해야 가장 효과적인 결과를 만들지에 대한 실험이 이어질 것이다. 이 과정에서 선진국에서 이미 저지른 실수를 참고할 필요가 있다. 한 번의 실수로 회사가 날아갈 수도 있다. "일본 최대 취업정보업체 리크루트는 실제 합격 통보 여부 등 여러 데이터를 조합한 후 인공지능으로 분석해, 특정인이 고객 기업 합격 후 입사를 안 할 확률을 계산했다. 이른바 개인별 ‘내정사퇴율’이라는 항목을 만든 것이다. 문제가 된 계기는 아예 작년부터 실명을 건넸기 때문이다." "사실 굴지의 데이터 사업자들에게는 이미 실명이니 가명 정보니 하는 것은 큰 의미가 없다. 여러분의 실명에 애초에 별 관심이 없기 때문이다. 언제 유튜브나 페이스북이 내 실명과 주민번호를 알아서 내 취향에 맞춰준 적이 있나. 내 이름도 주소도 아무것도 몰라도 내가 어떤 사림인지는 알고 있다. 그리고 충분한 동기 부여와 사정이 있다면, 그리고 타기업과의 데이터 결합만 있다면 가명은커녕 익명 정보로부터도 심지어 실명을 도출해낼 수 있다. 다만 하지 않을 뿐이다." "지난해 여름 네이처 학술지에 실린 한 논문은 알고리즘이 나이·성별·결혼 등 15개의 인구통계학적 속성만으로도 익명화된 개인을 99.98% 특정해낼 수 있음을 보여줬다. 하나의 데이터는 힘이 없지만, 여러 데이터가 더해질수록 입체감을 지닌다. 인구통계학적 속성보다 더 강력한 것은 행동 데이터다. 비밀번호와 ID를 입력할 때 타이핑 버릇만 갖고도 원래 주인인지 아닌지 구분해 내는 루마니아의 스타트업 ‘타이핑DNA’는 최근 구글 등으로부터 700만 달러 투자를 받았다."

[데이터 3법의 겉과 속] 당신의 정보는 당신을 위해 쓰이지 않는다

중앙시사매거진

[데이터 3법의 겉과 속] 당신의 정보는 당신을 위해 쓰이지 않는다

2020년 1월 20일 오전 5:27

댓글 0

주간 인기 TOP 10

지난주 커리어리에서 인기 있던 게시물이에요!