[ model-centric AI에서 data | 커리어리

[ model-centric AI에서 data-centric AI로 ] 앤드류 응 교수의 MLOps 관련 강연에 대해 잘 정리된 글이 있어서 공유합니다. 기존에는 데이터가 어떻든 일단 최대한 수집하고 모델링을 통해 성능을 개선하자는 이야기가 많았었는데요, 기존의 model-centric했던 것을 data-centric으로 즉, 데이터의 일관성을 개선하게 된다면 모델의 성능 개선에 더 효과적일 수 있다는 이야기입니다. 데이터 업무의 80%가 데이터 전처리로 사용되므로, 80%를 차지하는 데이터 자체에 더 관심을 가지고 개선하려는 노력이 필요하다고. 제일 하단의 문답에서 "data-centric AI와 model-centric AI를 하이브리드로 쓰면 안되나?" 질문에 대한 답변이 data-centric AI의 중요성을 잘 보여주는 것 같아요. "물론 가능하다. 그런데 우리가 그동안 model의 개발에 엄청난 리서치 역량을 많이 써왔기 때문에, 사실 모델은 github에서 좋은 모델만 받아와서 적용해도 좋은 성능을 내고, 더 개선하기가 쉽지 않다. 하지만 데이터는 (프로젝트별/비즈니스별로) 개선할 점이 아주 많다."

[MLOps] Model-centric AI에서 Data-centric AI로

Medium

2021년 4월 30일 오후 1:42

댓글 0

주간 인기 TOP 10

지난주 커리어리에서 인기 있던 게시물이에요!