SOTA 오픈소스 수학 LLM, WizardMath 모델 공개

MS에서 WizardLM, WizardCoder 모델을 공개하면서 complex instruction의 중요성을 일깨워줬었는데요. https://github.com/nlpxucan/WizardLM 이번엔 추가로 수학 전용 모델인 WizardMath (70B/13B/7B)을 릴리즈 했습니다. WizardMath 70B는 다음을 달성합니다: 1. GSM8k 벤치마크에서 Pass@1 81.6으로 ChatGPT-3.5, Claude Instant-1, PaLM-2 및 Chinchilla를 능가합니다. 2. MATH 벤치마크에서 Pass@1 22.7로 Text-davinci-002, GAL, PaLM, GPT-3을 능가합니다. 3. GSM8k와 MATH 모두에서 다른 모든 오픈 소스 LLM을 큰 차이로 능가합니다. - 아직 paper로 정리되진 않았는데 다음주에 곧 공개될 예정으로 보이네요. HF Weights: https://huggingface.co/WizardLM/WizardMath-70B-V1.0 Github: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 8월 13일 오전 8:14

댓글 0

    함께 읽은 게시물

    클로드 코드 Max 한 달 사용 후기

    ... 더 보기

    클로드 코드 한 달 사용 후기

    K리그 프로그래머

    클로드 코드 한 달 사용 후기

     • 

    댓글 2 • 저장 7 • 조회 2,229


    최적화 문제 속에 숨은 의도

    험한 산속에 5명이 고립되어 있습니다. 생존하려면 어둡고 위험한 다리를 건너 구조대에게 가야 합니다. 그러나 다음과 같은 제약 조건이 있습니다.

    ... 더 보기

    2019년에 저희 팀에서 퍼블리싱한 CHI 논문. 음성 인터페이스 입코딩을 이용한 프로그래밍 교육.

    ... 더 보기

    MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

    ... 더 보기

    MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT

    요즘IT

    MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT