골빈해커

Chief Maker

Pythia 2.8B 보다 성능이 낮았던 RedPajama 2.8B 모델을, 2배의 토큰인 600B 상당의 토큰으로 학습시킨 결과 성능이 Pythia-7B 을 뛰어넘었다고. LLaMA 도 증명했듯, GPT를 포함해 (아마도)대부분의 모델이 크기를 늘리지 않아도 더 많은 지식을 습득하면 더 높은 지능을 획득 할 수 있다는 뜻. 이제 당분간은 네트웍의 크기를 늘리는 일 보다는, 학습 해야 할 지식의 종류와 규모, 그리고 종류에 따른 학습 방법을 잘 선정하는 것이 중요한 것 같다.

더 많은 콘텐츠를 보고 싶다면?

이미 회원이신가요?

2023년 5월 1일 오후 4:13

•

조회 2,643

함께 읽은 게시물

여정민

Software Engineer

2024년 06월 16일

반드시 알아야 하는 7가지 데이터베이스 확장성 전략

Materialized Views:

•

저장 215 • 조회 5,445

장홍석

스페이스오디티 부대표/CPO

2일 전

< 진보는 조용히 오고, 파괴는 시끄럽게 온다 >

1. 문제는 고쳐지고 사람들은 적응한다. 위협이 크면 해결책이 나올 동인도 똑같이 커진다.

댓글 1 • 저장 3 • 조회 654

이유진

우아한 형제들 프로덕트 디자이너

2024년 02월 17일

생산성 수치심 (Productivity Shame) 극복하기 (1)

혹

Embracing Productivity Grace: Overcoming Shame for a Positive Work Mindset - RescueTime Blog

RescueTime Blog

•

저장 94 • 조회 7,387

비슷한 게시물

골빈해커 Chief Maker

메타 AI에서 Megabyte라는 트랜스포머를 대체 할 수 있는 새로운 뉴럴넷 아키텍처를 발표했습니다.

골빈해커 Chief Maker

OpenAI의 조직 구조에 대한 설명 및 장점과 리스크. 크.. 역시 GPT 짱먹으렴 🫰

서진호 sr. Presales Solution Architect, HPC&AI

<새 메타의 논문, LIMA에 대하여>

HoJoong Kim Senior IT guy

AI의 아버지가 구글 퇴사를 결심한 이유

HoJoong Kim Senior IT guy

[모두의연구소] Llama3 출시 : AI 전쟁의 서막

서진호 sr. Presales Solution Architect, HPC&AI

<엔비디아, OpenAI 에게 DGX H200 첫 납품?>

주간 인기 TOP 10

권태관 NAVER 소프트웨어 엔지니어

6년간의 토이프로젝트 여정을 마무리하며 - 기술블로그 구독서비스

psmon 웹노리라이터

DDD와 AI

Arawn Park Senior Engineer & Engineering Lead

올해로 개발자 생활이 햇수로 20년째다

유용우(요우) NAVER 백엔드 개발자

간만에 재밌게 읽은 기술 포스트 여름 이벤트 관련 개발 회고와 높

이원형 라인플러스 소프트웨어 엔지니어

고용노동부에서 주관하는 청년미래플러스 3기를 모집 중이라고 합니다

장홍석 스페이스오디티 부대표/CPO

< 가장 예쁜 사람이 아니라, 1등 할 사람에게 투표하라 >

골빈해커 Chief Maker

아직 나도 정립되지 않은 상태이긴한데, 실무에서의 바이브 코딩은

석민 커리어 코치

길은 잃은 이력서

SNEW 스뉴 start-up, VC and more

“실리콘밸리의 힘은 개인의 자율과 책임을 극대화한 것에 있다. 이

𝙍𝙞𝙘𝙝𝙖𝙧𝙙 처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

데이터 이력서 템플릿 + 작성 가이드를 사용해보세요.

댓글 0

함께 읽은 게시물

반드시 알아야 하는 7가지 데이터베이스 확장성 전략

< 진보는 조용히 오고, 파괴는 시끄럽게 온다 >

생산성 수치심 (Productivity Shame) 극복하기 (1)

비슷한 게시물

주간 인기 TOP 10

추천 프로필