골빈해커

Chief Maker

Llama 3에서 인상적인 점은 코드 데이터를 더 많이 넣어 추론 능력을 향상시켰고, 다국어 데이터도 꽤 많이 넣어 다국어 능력도 상당히 좋아졌다는 것 입니다.

그보다 학습 데이터의 양이 15T(조)개의 토큰으로 이루어져 있다는 것이 대단히 인상적인데요. 2T를 사용한 Llama 2의 7.5배나 되는 수준의 엄청난 양 입니다.

그런데, 8B 모델도 이정도 양의 데이터로도 수렴하지 않는 것 같다고 언급되었습니다. 이는 8B 모델도 성능 향상을 더 꾀할 수 있다는 얘기라고 보면 됩니다.

앞으로 다양한 목적의 모델을 더 내 놓을 것이라고 하는데요. 400B 모델도 그렇고 상당히 기대가 됩니다.

고성능의 오픈소스 모델의 춘추 전국 시대가 온 지 얼마 안된 것 같은데, 다시 한 번 Llama로 수렴되려나요? 과연 작은 LLM 모델을 개발하는 스타트업들은 어떻게 반응할까요? 이번주는 Llama 덕분에 재미난 한 주가 되겠네요. 😎🍿🥤

더 많은 콘텐츠를 보고 싶다면?

이미 회원이신가요?

2024년 4월 19일 오전 2:43

저장 1 • 조회 1,774

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

2일 전

< 보여서 걷는 게 아니라, 걷다 보니 길 >

댓글 1 • 저장 4 • 조회 668

골빈해커

Chief Maker

7월 28일

앞으로의 코테는 설명을 주고 코드를 짜라고 하는 것이 아니라, 코드를 주고 설명을 하라는 것이 유효할 것이다.

내 경우는 이미 그렇게 하고 있는데, 요구사항을 주고 개발을 요청. 결과물이 요구사항대로 개발이 잘 되었다면, 다음 단계로 제출한 코드를 리뷰하며 설명을 요청한다.

•

댓글 2 • 저장 21 • 조회 3,547

골빈해커

Chief Maker

2일 전

나는 종종 생산성을 올리기 위한 각종 개발 툴은 물론, 라이브러리나 소스 코드를 구매하기도 한다.

소스 코드의 경우 실제로 써먹지 못하는 경우도 상당수 되긴 하지만, 그래도 구성이나 코드를 보면서 배우는게 있기 때문에 학습 비용이라고 생각하고 가끔 구매하는 편이다.

저장 3 • 조회 1,577

데이터리안

Data Analyst

하루 전

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

데

- YouTube

www.youtube.com

저장 4 • 조회 580

비슷한 게시물

골빈해커 Chief Maker

📰 OpenAI, 50% 저렴한 Batch API 출시

이병헌 프롬프트 엔지니어

https://arxiv.org/pdf/2310.08754.pdf

골빈해커 Chief Maker

📰 Upstage, 22B 모델 Solar Pro 출시

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0909]모두에게 전하는 모두연 AI뉴스!

골빈해커 Chief Maker

머신러닝(AI) 모델 공개시에 이제 “Open Weight” 이라는 표현이 보편적으로 쓰이게 된 것 같네요.

서지연 개발자

[Coursera] Generative AI for SW Dev

주간 인기 TOP 10

골빈해커 Chief Maker

오늘의 탐라는 “ChatGPT 쓰셨던데 그러고도 개발자입니까?”

김의중 프론트엔드 개발자

Claude Code 실전 가이드: AI 네이티브 개발자로 가는

Arawn Park Senior Engineer & Engineering Lead

넷플릭스는 왜 WebFlux를 사용하지 않을까?

psmon 블룸에이아이 서버 엔지니어

카프카를 우아하게 사용하기 -코틀린편

달레 Apollo GraphQL Software Engineer

알아 알아 알아! 🤣

장홍석 스페이스오디티 부대표/CPO

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

황경찬(Boaz) P.E.C CEO

"AI가 코드를 짜는 시대, 개발자의 가치는 무엇일까요?" 최근

정종윤 네이버 프론트엔드 개발자

👻 클라이언트에서 안전한 소셜 로그인 구현을 위한 OIDC와 PK

박승규 카카오계열사에서 이것저것 만드는 개발자

책이 출판되기 전 마지막 교정을 하고 있는데... GPT5가 출시

석민 커리어 코치

백엔드 개발자 이력서 고민

댓글 0

함께 읽은 게시물

< 보여서 걷는 게 아니라, 걷다 보니 길 >

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

비슷한 게시물

주간 인기 TOP 10

추천 프로필