<머신러닝 함정을 피하는 방법: 아카데미 연구원을 위한 가이드> 커리어리 친구들, 마이클 론스가 적은 가칭 '머신러닝 연구자를 위한 제언'에 대해 한번 읽어 보시기 바랍니다. 원래는 영어 논문인데 한글로 잘 번역해 주었습니다. 관련하여 주제를 다음과 같이 정리합니다. 1. 모델을 만들기 전에 해야할 일 1.1. 데이터를 살펴보세요 1.2. 모든 데이터를 보지 마세요 1.3. 충분히 많은 데이터를 확보하세요 1.4. 도메인 전문가들과 소통하세요 1.5. 많은 사전 조사를 하세요 1.6. 모델이 배포되는 상황을 고려하세요 2. 신뢰할 수 있는 모델을 만드는 방법 2.1. 테스트 데이터의 정보가 유출되지 않게 하세요 2.2. 다양한 모델을 사용해보세요 2.3. 부적절한 모델 사용하지 않기 2.4. 하이퍼파라미터를 최적화하세요 3. 모델을 올바르게 평가하는 방법 3.1. 적절한 테스트 데이터를 사용하세요 3.2. 검증 데이터를 사용하세요 3.3. 모델을 여러 번 평가하세요 3.4. 불균형한 데이터에는 정확도를 사용하지 마세요 4. 모델을 공정하게 비교하는 방법 4.1. 더 큰 숫자가 더 좋은 모델을 의미하지 않습니다 4.2 커뮤니티 벤치마크를 신뢰하지 마세요 5. 결과를 보고하는 방법 5.1. 결과를 투명하게 공개하세요 5.2. 여러가지 방법으로 성능을 측정하세요 5.3. 데이터를 넘어선 일반화를 하지 마세요 내용이 상당히 길지만 인공지능에서 모델을 만드는데 많이 도움이 될 것으로 기대합니다. 원문: https://arxiv.org/abs/2108.02497

머신러닝 연구자들을 위한 제언 (번역)

ryanking13.github.io

머신러닝 연구자들을 위한 제언 (번역)

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2021년 9월 14일 오전 1:14

댓글 0