영현

GeoAI 연구원

🌎 국내 기업, 오픈LLM 세계 1위!!

'투디지트' 라는 국내 기업에서 허깅페이스의 Open LLM Leaderboard 1위를 달성하는 소식이 있었습니다. 해당 모델이 국내 KO-LLM Leaderboard에서 1위를 차지한 뉴스까지만 해도, '국내 데이터에 대한 성능 개선' 사례 정도로 생각했습니다.

하지만 이번 소식은 한국어에 대한 지표가 아닌 'LLM 모델 자체의 성능 지표를 크게 개선했다'는 점에서 더욱 유의미한 것 같습니다.

모델에 대한 상세한 설명은 담겨있지 않지만, 핵심 키워드로 SGD : A Study on Self-Generated Dataset creation method for DPO Learning 라는 방법을 제안하고 있습니다. 모델이 생성한 문장과 정답 문장(기존 데이터셋)을 비교하여, 기존 데이터셋에 없는 문장을 추가한다는 아이디어를 활용했다고 합니다.

리더보드의 지표를 살펴보면, 해당 모델은 HellaSwag라는 지표에서 월등한 차이를 만들어 1위를 차지하고 있습니다.

HellaSwag

목적: 상식 추론 HellaSwag는 미완성된 구절을 LLM으로 하여금 완성하게 합니다. 문맥에 따라 텍스트를 이해하고 예측하는 능력을 테스트함으로써 LLM의 상식 추론을 평가합니다.
예시: 불완전한 구절이 주어지고, 주어진 문맥에서 논리적으로 이어지는 결말을 LLM이 생성해야 합니다.

아마 GAN과 같이 데이터셋의 적절한 증강이 모델의 안정성을 높이는데 영향을 주지 않았나 싶습니다. 금융 AI를 연구하던 업체에서 나온 결과라 다소 뜬금없을 수 있습니다. 하지만 LLM 모델의 근간이 되는 시계열 연구가 금융계의 오랜 숙제였던 점을 생각하면 이해가 되기도 합니다 ㅎㅎ

허깅페이스 리더보드

https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard

(모델명 : davidkim205/Rhea-72b-v0.5)

뉴스 기사

https://kr.aving.net/news/articleView.html?idxno=1789199

Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4

huggingface.co

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 3월 29일 오전 9:17

저장 1 • 조회 188

함께 읽은 게시물

유용우(요우)

NAVER 백엔드 개발자

6일 전

성장이 어려운 환경에서의 개발자 생활

저런 개발자 생활도 한적이 있어서 다양한 생각이 든다.

“어이 신입, 탈출각이다” | 요즘IT

요즘IT

저장 7 • 조회 1,063

Somewon Yoon

프로젝트 썸원 Content Owner

3월 27일

커리어를 쌓아야 할 때 알아야 하는 잔인한 사실들

•

저장 77 • 조회 4,266

이명진

한국레드햇 솔루션 아키텍트

2024년 04월 29일

상위 1% 파이썬 개발자가 사용하는 백엔드 레포지토리 TOP 8

상

🐍 8 backend repos used by the top 1% of python devs 🏆

Medium

저장 27 • 조회 2,182

김챈스78

매일 책읽는 일러스트레이터.

2일 전

노력도 배신한다...250714

1.●관계를 결정하는건 그 사람의 태도이다.
2.●운이 안따른다고 생각이 들면 좀 기다려야 한다.

•

저장 2 • 조회 87

변성윤

머신러닝 엔지니어, Engineering Manager

7월 2일

무신사의 대용량 트래픽 경험기

치

무진장 힘들었지만 무진장 성장한 개발 이야기

Medium

댓글 2 • 저장 32 • 조회 2,132

이양일

NaverCloud 백엔드 개발자

4일 전

품질 높은 프로젝트는 어떻게 만들어질까? 🤔

안

“품질 높은 프로젝트는 어떻게 만들어질까?”

F-Lab : 상위 1% 개발자들의 멘토링

저장 5 • 조회 1,199

비슷한 게시물

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

데이터 분석 프로세스 로드맵

영현 GeoAI 연구원

🌎 2년 내 LLM 학습 데이터 고갈...

HoJoong Kim Senior IT guy

[LLM Watch] 차세대 RAG의 특징

김선호 여기어때컴퍼니 / User Behavior Team Lead

데이터기반 의사결정 문화 만들기

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

회귀 분석의 오류를 측정하는 지표 3형제를 알아봅시다.

영현 GeoAI 연구원

🧐 도메인은 모르지만 인과추론은 하고 싶어

주간 인기 TOP 10

권태관 NAVER 소프트웨어 엔지니어

6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스

psmon 웹노리라이터

DDD와 AI

Arawn Park Senior Engineer & Engineering Lead

올해로 개발자 생활이 햇수로 20년째다

유용우(요우) NAVER 백엔드 개발자

간만에 재밌게 읽은 기술 포스트 여름 이벤트 관련 개발 회고와 높

이원형 라인플러스 소프트웨어 엔지니어

고용노동부에서 주관하는 청년미래플러스 3기를 모집 중이라고 합니다

장홍석 스페이스오디티 부대표/CPO

< 가장 예쁜 사람이 아니라, 1등 할 사람에게 투표하라 >

골빈해커 Chief Maker

아직 나도 정립되지 않은 상태이긴한데, 실무에서의 바이브 코딩은

석민 커리어 코치

길은 잃은 이력서

SNEW 스뉴 start-up, VC and more

“실리콘밸리의 힘은 개인의 자율과 책임을 극대화한 것에 있다. 이

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

데이터 이력서 템플릿 + 작성 가이드를 사용해보세요.

🌎 국내 기업, 오픈LLM 세계 1위!!

댓글 0

함께 읽은 게시물

커리어를 쌓아야 할 때 알아야 하는 잔인한 사실들

상위 1% 파이썬 개발자가 사용하는 백엔드 레포지토리 TOP 8

노력도 배신한다...250714

무신사의 대용량 트래픽 경험기

품질 높은 프로젝트는 어떻게 만들어질까? 🤔

비슷한 게시물

주간 인기 TOP 10

추천 프로필