전동현

네이버 AI Research Engineer / Leader

SOTA 오픈소스 수학 LLM, WizardMath 모델 공개

MS에서 WizardLM, WizardCoder 모델을 공개하면서 complex instruction의 중요성을 일깨워줬었는데요. https://github.com/nlpxucan/WizardLM 이번엔 추가로 수학 전용 모델인 WizardMath (70B/13B/7B)을 릴리즈 했습니다. WizardMath 70B는 다음을 달성합니다: 1. GSM8k 벤치마크에서 Pass@1 81.6으로 ChatGPT-3.5, Claude Instant-1, PaLM-2 및 Chinchilla를 능가합니다. 2. MATH 벤치마크에서 Pass@1 22.7로 Text-davinci-002, GAL, PaLM, GPT-3을 능가합니다. 3. GSM8k와 MATH 모두에서 다른 모든 오픈 소스 LLM을 큰 차이로 능가합니다. - 아직 paper로 정리되진 않았는데 다음주에 곧 공개될 예정으로 보이네요. HF Weights: https://huggingface.co/WizardLM/WizardMath-70B-V1.0 Github: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 8월 13일 오전 8:14

저장 2 • 조회 863

함께 읽은 게시물

K리그 프로그래머

커피한잔 개발자

6일 전

클로드 코드 Max 한 달 사용 후기

클

클로드 코드 한 달 사용 후기

K리그 프로그래머

•

댓글 2 • 저장 7 • 조회 2,229

한종현

CTO @ Triple Comma Corp.

하루 전

최적화 문제 속에 숨은 의도

험한 산속에 5명이 고립되어 있습니다. 생존하려면 어둡고 위험한 다리를 건너 구조대에게 가야 합니다. 그러나 다음과 같은 제약 조건이 있습니다.

저장 2 • 조회 669

골빈해커

Chief Maker

3일 전

2019년에 저희 팀에서 퍼블리싱한 CHI 논문. 음성 인터페이스 입코딩을 이용한 프로그래밍 교육.

저장 1 • 조회 1,080

이양일

NaverCloud 백엔드 개발자

2일 전

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

올

MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT

요즘IT

저장 8 • 조회 1,091

비슷한 게시물

서진호 sr. Presales Solution Architect, HPC&AI

<일론 머스크의 그록1 오픈소스 공개>

서진호 sr. Presales Solution Architect, HPC&AI

<작고 효율적인 sLLM인 TinyLlama>

전동현 네이버 AI Research Engineer / Leader

최근 MS에서 작성한 CodeFusion: A Pre-trained Diffusion Model for Code Generation (https://arxiv.org/abs/231

골빈해커 Chief Maker

ChatGPT에 드디어 올 것이 왔군요.

최고은 프로덕트 디자이너

🤖생성형 AI 툴로 디자인해보자! (스터디 후기)

데분가 NAVER 데이터분석

우리나라 SI 산업 생태계는 왜 붕괴되었을까?

주간 인기 TOP 10

권태관 NAVER 소프트웨어 엔지니어

6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스

psmon 웹노리라이터

DDD와 AI

Arawn Park Senior Engineer & Engineering Lead

올해로 개발자 생활이 햇수로 20년째다

유용우(요우) NAVER 백엔드 개발자

간만에 재밌게 읽은 기술 포스트 여름 이벤트 관련 개발 회고와 높

이원형 라인플러스 소프트웨어 엔지니어

고용노동부에서 주관하는 청년미래플러스 3기를 모집 중이라고 합니다

장홍석 스페이스오디티 부대표/CPO

< 가장 예쁜 사람이 아니라, 1등 할 사람에게 투표하라 >

골빈해커 Chief Maker

아직 나도 정립되지 않은 상태이긴한데, 실무에서의 바이브 코딩은

석민 커리어 코치

길은 잃은 이력서

SNEW 스뉴 start-up, VC and more

“실리콘밸리의 힘은 개인의 자율과 책임을 극대화한 것에 있다. 이

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

데이터 이력서 템플릿 + 작성 가이드를 사용해보세요.

SOTA 오픈소스 수학 LLM, WizardMath 모델 공개

댓글 0

함께 읽은 게시물

클로드 코드 Max 한 달 사용 후기

최적화 문제 속에 숨은 의도

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

비슷한 게시물

주간 인기 TOP 10

추천 프로필