최근에 DMOps (Data Management Operation and Recipes) 라는 주제로 페이퍼를 냈었습니다.
😯 어떤 논문인가요?
실제로 데이터를 구축할 때 주요 꼭지가 되는 12단계를 정리한 논문이었는데요, 어떠한 태스크에도 적용이 가능하고 기업에서 실질적으로 사용할 수 있도록 필수적인 단계들만 남긴 파이프라인입니다. 믿음직한 육수가 있으면 김치찌개든, 된장찌개든 끓일 수 있으니까요! 저희는 이 변치않는 육수를 만들고 싶었습니다.
🤓 어디에 논문을 냈나요?
이 논문을 냈던 곳은 데이터 중심 머신러닝 연구(Data-centric Machine Learning Research·DMLR) 2023 워크숍인데요 (https://dmlr.ai/), 글로벌 머신러닝 학회(ICML)가 개최하는 학술 행사로, 이 곳에는 Data-Centric AI의 아버지라고 불리는 Andrew Ng 교수님이 직접 참가하시고, 더 나아가 매년 해당 분야의 많은 연구자들이 집대성하는 곳입니다. Data-Centric AI라는 용어가 탄생한 NIPS 2021 DCAI를 시작으로 이어지는 Data-Centric AI 관련된 근본이 있는 워크숍이라고도 할 수 있어요.
DMOps의 파이프라인 이미지와 논문 링크 첨부합니다.
👉 논문 : https://arxiv.org/pdf/2301.01228.pdf
다음 편에서는 "왜 데이터를 직접 만들 수 밖에 없을까?" 에 대해 다뤄볼게요!