< 성공적인 머신러닝 프로젝트를 위한 17가지 | 커리어리

< 성공적인 머신러닝 프로젝트를 위한 17가지 핵심 질문 > 당신이 머신러닝 프로젝트를 시작하기 전 꼭 던져보아야 할 17개의 핵심 질문들입니다. 👉사업에 대한 이해 Business Understanding 1. 머신러닝 시스템으로 얻고자 하는 것은 무엇인가요? 2. 개발하고자 하는 어플리케이션의 정확한 시나리오는 무엇이며, 어떤 비즈니스 임팩트를 기대하나요? 3. 머신러닝을 활용했을 때 예상되는 성능과 한계를 제대로 이해하고 있나요? 4. 머신러닝 모델의 성능을 어떻게 모니터링하고 측정할 계획인가요? 👉모델링 Modeling 5. 어떤 머신러닝 모델을 활용할 계획인가요? 6. 컴퓨팅 속도(inference speed), 정확도(accuracy), 정밀도(precision), 재현율(recall) 면에서 성능을 담보할 수 있는 필수 조건(requirements)은 무엇인가요? 7. 학습을 위한 필수 조건은 무엇인가요? 클라우드 컴퓨팅 서버에 의존할 계획인가요? 모델은 지속적으로 업데이트 되어야 하나요? 👉 데이터 확보 & 이해 Data Acquisition & Understanding 8. 모델을 훈련시키기 위한 충분한 데이터를 확보하였나요? 그렇지 않다면, 추가적인 데이터를 어떻게 수집할 것인가요? 크라우드 소싱? 웹 크롤링? 또는 미리 만들어진 데이터를 구매할 예정이신가요? 9. 데이터 소스를 법적으로 어디까지 활용할 수 있나요? 데이터에 대한 권리를 보유했나요? 10. 데이터증강 기술을 사용할 예정인가요? 11. 서비스 유저들이 만들어 내는 데이터를 활용할 수 있나요? 👉데이터 라벨링 Data Labeling 12. 누가 데이터 라벨링 작업을 진행하나요? 회사 내부에 인하우스(in-house) 데이터 라벨링 팀이 있나요? 외부의 데이터 라벨링 업체를 용역으로 활용하나요? 13. 어떤 데이터 라벨링 도구를 사용할 예정인가요? 활용하고자 하는 라벨링 도구나 시각화, 통계, 버전 관리, 팀 협업 등 원하는 기능을 제공하고 있나요? 14. 라벨링 속도를 높여줄 수 있는 이미 학습된 모델을 사용할 예정인가요? 그렇다면, 그 모델을 계속 더 훈련시킬 수 있나요? 얼마나 자주 이 모델을 추가적으로 훈련 시킬 수 있나요? 👉모델 훈련 Model Training 15. 데이터 세트를 구축한 다음에, 모델을 훈련시키기 위해서는 어떤 인프라를 사용하나요? 내부에 GPU 서버를 사용하나요? Cloud를 서버를 사용하나요? 16. TPU와 같은 더 고도의 하드웨어도 필요한가요? 17. 내부에서 모델을 훈련시킬 예정인가요, 아니면 외부의 모델 훈련 서비스를 활용할 예정인가요? 하이퍼 파라미터 튜닝(hyper-parameter tuning)과 신경 구조 검색(architecture search) 등을 자동화 할 예정인가요? (Auto-ML을 활용하나요?)

성공적인 머신러닝 프로젝트를 위한 17가지 핵심 질문

Superb AI Blog

2021년 5월 5일 오후 2:33

댓글 0

주간 인기 TOP 10

지난주 커리어리에서 인기 있던 게시물이에요!

현직자들의 '진짜 인사이트'가 담긴 업계 주요 소식을 받아보세요.

커리어리 | 일잘러들의 커리어 SNS