어제 회사에서 기술 초청세미나로 차경진 교수님의 《데이터로 경험을 디자인 하라》를 들었습니다. '19년부터 빅데이터 과제를 맡아 진행을 해오면서 고민하고 생각했던 것들이 강의 내용과 일맥상통 하는게
어제 회사에서 기술 초청세미나로 차경진 교수님의 《데이터로 경험을 디자인 하라》를 들었습니다. '19년부터 빅데이터 과제를 맡아 진행을 해오면서 고민하고 생각했던 것들이 강의 내용과 일맥상통 하는게 많았습니다. 여러 내용 중에 오늘 업무에서도 협의한 내용인데 데이터가 많다고 더 인사이트가 있거나 정확하지 않다는 점입니다. "Garbage in Garbage out." 머신러닝을 할 때 많은 데이터와 인자를 하면 더 정확할것 같지만 배가 많으면 사공으로 가듯이 많은 인자는 오히려 정확도를 떨어뜨리고 정제되지 않은 데이터는 오히려 노이즈가 많아지게 됩니다. 데이터는 많이 수집하지만 "목적에 맞는 데이터 수집"이 중요하고 이 목적은 차경진 교수님이 세미나중 자주 언급한 "맥락"에 맞는 데이터여야 함을 다시 한번 느끼게 됩니다.