<머신러닝 함정을 피하는 방법: 아카데미 연구 | 커리어리

<머신러닝 함정을 피하는 방법: 아카데미 연구원을 위한 가이드> 커리어리 친구들, 마이클 론스가 적은 가칭 '머신러닝 연구자를 위한 제언'에 대해 한번 읽어 보시기 바랍니다. 원래는 영어 논문인데 한글로 잘 번역해 주었습니다. 관련하여 주제를 다음과 같이 정리합니다. 1. 모델을 만들기 전에 해야할 일 1.1. 데이터를 살펴보세요 1.2. 모든 데이터를 보지 마세요 1.3. 충분히 많은 데이터를 확보하세요 1.4. 도메인 전문가들과 소통하세요 1.5. 많은 사전 조사를 하세요 1.6. 모델이 배포되는 상황을 고려하세요 2. 신뢰할 수 있는 모델을 만드는 방법 2.1. 테스트 데이터의 정보가 유출되지 않게 하세요 2.2. 다양한 모델을 사용해보세요 2.3. 부적절한 모델 사용하지 않기 2.4. 하이퍼파라미터를 최적화하세요 3. 모델을 올바르게 평가하는 방법 3.1. 적절한 테스트 데이터를 사용하세요 3.2. 검증 데이터를 사용하세요 3.3. 모델을 여러 번 평가하세요 3.4. 불균형한 데이터에는 정확도를 사용하지 마세요 4. 모델을 공정하게 비교하는 방법 4.1. 더 큰 숫자가 더 좋은 모델을 의미하지 않습니다 4.2 커뮤니티 벤치마크를 신뢰하지 마세요 5. 결과를 보고하는 방법 5.1. 결과를 투명하게 공개하세요 5.2. 여러가지 방법으로 성능을 측정하세요 5.3. 데이터를 넘어선 일반화를 하지 마세요 내용이 상당히 길지만 인공지능에서 모델을 만드는데 많이 도움이 될 것으로 기대합니다. 원문: https://arxiv.org/abs/2108.02497

머신러닝 연구자들을 위한 제언 (번역)

ryanking13.github.io

2021년 9월 14일 오전 1:14

댓글 0

함께 보면 더 좋은

커리어리 친구들, 점점 더 프로그래밍 세계는 로우코드/노코드(low code/no code) 추세로 흘러 가고 있습니다. 현재 라스베가스에서 아마존이 re:Mars 라는 행사를 진행하고 있습니다. 여기에서 깃허브 코파일럿(Copilot) 보다 한단계 진보적인 인공지능 프로그래밍 추천 서비스인 AWS 코드위스퍼러(CodeWhisperer)를 선보였습니다. 이유는 단순히 코드 추천이 아니라 프로그래밍 현실에서 일어날 수 있는 문제를 해결하는데 집중했다고 합니다. 아래의 링크에 자세한 설명이 나와 있습니다. 제가 살펴보니 다음 같은 몇 가지 주요 기능이 눈길을 끌었습니다. 🦒 프로젝트 내 다른 파일에 있는 코드를 판단하여, 본인의 코딩 스타일과 앞뒤 변수 이름에 맞게 맞춤형으로 코드를 추천합니다. 🦒 코드 주석을 기반으로 구현 코드와 일치하는 유닛 테스트 코드를 자동으로 추천하여, 반복적인 유닛 테스트 코드 작성을 쉽게합니다. 🦒 적어도 두 개 이상의 다른 코드를 추천하면서 (오픈소스) 코드 라이선스 정보도 함께 보여주어 개발자가 선택할 수 있게 해 줍니다. 🦒 만약 개발자가 추천해 준 코드를 바꾸었을때, 변경한 코드로 인해 보안 취약점이 없는지 확인해 주는 기능도 포함됩니다. 🦒 수 많은 AWS API의 예제를 포함해서 개발자가 다양한 AWS 서비스를 활용하는 코드를 작성하는 데 도움을 줄 수 있습니다. 🦒 Python, Java 및 JavaScript를 지원하고, VS Code, IntelliJ, PyCharm, WebStorm 및 AWS Cloud와 Lambda 콘솔을 지원합니다. 깃허브 코파일럿만 해도 반복적인 코딩 작업을 줄여 들게 하는 데 코드위스퍼러 같은 경우엔 좀더 문제해결에 접근하는 방식으로 이루어져 앞으로 많이 사용하게 될 것 같습니다.

ML-Powered Coding Companion for Developers - Amazon CodeWhisperer Features - Amazon Web Services

Amazon Web Services, Inc.

추천 프로필

현직자에게 업계 주요 소식을 받아보세요.

현직자들의 '진짜 인사이트'가 담긴 업계 주요 소식을 받아보세요.

커리어리 | 일잘러들의 커리어 SNS