LLM 성능, 어떻게 평가하는 것일까? (feat. lm-eval-harness)
devocean.sk.com
GPT 버전업이나 새로운 LLM이 나올 때, 성능평가표도 함께 나오는데요.
많은 전문가분들이 첨언해주셔서 그대로만 이해했는데,
어떻게 평가할 수 있는지에 대해 아래 굉장히 쉽게 자세하게 나오네요!
AI에 관심있는 분들은 꼭 읽어보세요! 🤓
https://devocean.sk.com/blog/techBoardDetail.do?ID=166716&boardType=techBlog&searchData=&searchText=&id=&techType=&searchDataSub=&searchDataMain=
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 9월 9일 오전 6:10
Q
... 더 보기요즘 오프라인 가게에서 점점 더 많이 보이는 ‘토스 결제 단말기’. 그 이유를 알아보니, ❶ 투박한 카드 결제기를 ‘고객 경험 요소’로 탈바꿈시켰고 ❷ 포스 프로그램 무료화로 사장님들의 경제적 부담을 덜어줬다. 그리고 이 모든 것에는 ‘데이터’에 관한 토스의 큰 그림이 녹아있다.
“두 명의 학생이 있습니다. 한 명은 학기 초부터 뛰어난 퍼포먼스를 보입니다. 중간고사에서 100점 만점에 98점을 받더니 기말고사에서 80점을 기록합니다. 다른 학생은 중간고사 70점, 기말고사 88점을 받습니다. 어느 학생이 뛰어난 걸까요?”
... 더 보기