Kimjeongeun

모두의연구소 아이펠캠퍼스 퍼실리테이터

[0723]모두에게 전하는 모두연 AI뉴스!

Meta의 Llama3.1의 벤치마크 유출

Meta의 Llama3.1의 초기 벤치마크가 서브레딧에 유출되었습니다. Meta는 4월 지난 4월 Meta가 출시한 Llama3 8B와 70B를 출시하면서, 가장 큰 모델이 4000억 개 이상의 매개변수를 가질 것이며 아직 훈련 중이라고 밝혔었으며, 지칭한 모델은 4000억개의 매개변수를 가진 Llama3.1 405B로 확인되었습니다. 이 모델은 Llama3.1 8B, 70B와 함께 곧 출시될 예정이었다고 합니다. 유출된 데이터에 따르면 Meta Llama 3.1은 GSM8K, Hellaswag, boolq, MMLU-humanities, MMLU-other, MMLU-stem, winograd 등 여러 테스트에서 GPT-4o를 능가합니다. 그러나 HumanEval과 MMLU-social sciences에서는 약세를 보였습니다. 이는 오픈소스 모델이 현재 최고 수준의 비공개 LLM 모델을 처음으로 능가할 수 있다는 점에서 오픈소스 AI 커뮤니티에 중요한 이정표가 될 것이라고 합니다. 특히 이 수치들이 Llama 3.1의 기본 모델에서 나온 것이며, 모델의 잠재력을 완전히 발휘하려면 명령어 튜닝이 중요하기 때문에, Llama 3.1 모델의 Instruct 버전이 출시되면 이러한 결과들 중 많은 부분이 개선될 수 있다고 합니다.

https://www.reddit.com/r/LocalLLaMA/comments/1e98zrb/llama_31_405b_base_model_available_for_download

애플 연구진의 훈련이 필요없는 Video LLM SF-LLaVA

애플 연구진이 훈련이 필요 없는 Video LLM SF-LLaVA를 소개하였습니다. SF-LLaVA는 일반적으로 사용되는 LLM의 토큰 제한을 초과하지 않으면서 상세한 공간적 의미(semantics) 와 장기적인 시간적 맥락(context)을 동시에 포착할 수 있습니다. 비디오 LLM을 위한 두 개의 스트림 : Slow / Fast 입력 설계를 사용하여 샘플링된 비디오 프레임에서 특징을 효과적으로 집계합니다. Slow 경로는 낮은 프레임 속도에서 특징을 추출하면서 가능한 한 많은 공간적 세부 사항을 유지하고(예: 24×24 토큰), Fast 경로는 높은 프레임 속도로 작동하지만 더 큰 공간 풀링 보폭을 사용하여(예: 6배 다운샘플링) 모션 단서에 집중합니다. 결과적으로, 이 설계는 비디오를 따라 세부 사항을 이해하는 데 유익한 공간적, 시간적 특징을 모두 적절하게 포착할 수 있게 합니다. 실험 결과, SF-LLaVA는 광범위한 비디오 작업에서 기존의 훈련이 필요 없는 방법들을 능가하는 성능을 보여줍니다. 일부 벤치마크에서는 비디오 데이터셋으로 미세 조정된 최첨단 비디오 LLM과 비교하여 동등하거나 심지어 더 나은 성능을 달성합니다.

https://arxiv.org/pdf/2407.15841

AI 개발자 과정의 압도적인 수준 차이! 입문자에서 전공자까지! 아이펠 9기 모집중 : https://bit.ly/4ePP8iK (편집됨

LLaMA 3.1 405B base model available for download : r/LocalLLaMA

reddit.com

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 7월 23일 오전 4:24

함께 읽은 게시물

장홍석

스페이스오디티 부대표/CPO

2일 전

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

•

댓글 1 • 저장 2 • 조회 826

골빈해커

Chief Maker

2일 전

OpenAI의 오픈소스 모델 gpt-oss 시리즈의 차별점(?) 중에 하나는 가중치를 4.25bit 양자화해서 공개했다는 것이다.

저장 3 • 조회 1,041

골빈해커

Chief Maker

2일 전

간밤에 OpenAI가 오픈소스 모델을 발표했네요.

저장 3 • 조회 1,143

박승규

카카오계열사에서 이것저것 만드는 개발자

2일 전

제가 쓴 "요즘 AI 에이전트 개발"이 출간 예정입니다!

제

요즘 AI 에이전트 개발, LLM RAG ADK MCP LangChain A2A LangGraph | 박승규 - 교보문고

product.kyobobook.co.kr

저장 1 • 조회 838

이재현

성장 파트너, 크리에이터

2023년 03월 22일

‘망했다’는 순간에 우주 제일의 기회가 있다

- 아, 난 망한 것 같아. 이런 경력으로 어디 가겠어? - 이 나이에 이러고 있으면… 그냥 대충 살아야지 뭐 - 다들 너무 잘났는데… 난 정말 뭐하는 걸까 삶은 성장하지 않는 자에게 가차없이 쇠망치를 내려칩니다. 알을 깨지 않고 안주하는 자는, 쇠망치를 맞으며 자신이 망했다고 생각합니다. 난 포지션을 잘못 잡았고, 너무 나이가 많고, 이제 기회는 없고, 다들 너무 잘났고 뛰어나다고. 아 진짜 뭘 어떻게 해야되지? 아무짝에도 도움이 되지 않는 걱정은 미뤄두고 일단 치킨을 시킵니다. 넷플릭스를 켭니다. 게임을 시작합니다. 날카로웠던 정신은 무뎌지고, 살아났던 감각이 다시 죽어가죠. 한때 레이저를 쏟아대던 눈빛, 세상을 다 가졌던 표정은 이제 거울 반대편에서 좀비처럼 나를 응시하고 있을 뿐입니다. 그냥 대충 살아야지 뭐. 오늘은 저에게 개인적으로 큰 의미가 있는 날입니다. 5년전의 나, 10년전의 내가 읽었다면 큰 가치를 느꼈을 콘텐츠를 기획해서 발행한 날입니다. 제가 쓴 것은 아니지만, 커리어 여정에서 길을 잃은 사람에게 힘이 되어주는 지도가 있으면 좋겠다고 생각했습니다. 서문에 쓴 이야기는 다름 아닌 제 이야기이며, 이런 문... 더 보기

저장 1 • 조회 375

강재상

스타트업 육성, Corprate Venturing, 사업, 커리어, 작가

7월 31일

초중고딩 어렸을 적 과학시간에 석유와 석탄이 만들어지는 원리와 과정을 배울 때마다 이해가 되지 않아서 그냥 외웠었다. 석유는 공룡을 비롯 동물이 죽어서 만들어지고 석탄은 식물이 죽어서 만들어진다고 배웠는데, 석탄이야 식물이 워낙 많았고 죽으면 자연스럽게 땅에 묻히니 그럴 수도 있겠다 이해가 되었지만, 석유는 아무리 생각해도 말이 안되었다. 동물이 화석이 될 확율이 극도로 낮다는 점을 생각하면 동물이 한꺼번에 같은 장소에서 갑자기 많이 죽어서 결국 석유까지 될 확율은 매장되어 있는 석유량을 볼 때 더 말이 안된다고 생각했기 때문이다. 그래서 배울 때마다 당시 과학선생님들께 이해가 안된다고 질문을 드렸으나 속시원한 답을 들어본 적은 없었다. 그렇게 10대에 그 궁금증을 묻고 지금까지 잊고 살았다. 그러다 우연히 생각나서 찾아보니...

비행기가 나는 과학적 원리와 마찬가지로 과학자들조차 속 시원하게 설명하기 어려운 질문 중 하나라고 한다. 많은 학설 중 다수의 과학자와 전문가들이 동의하는 하나는 바다 미생물 이론인데, 이 이야기는 들으면서 고개가 끄덕여질 정도로 납득이 되더라.

저장 1 • 조회 847

비슷한 게시물

골빈해커 Chief Maker

📰 OpenAI, 50% 저렴한 Batch API 출시

박종민 디자인 리드

캔버스: 노션까지 넘보는 ChatGPT의 새 기능

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0909]모두에게 전하는 모두연 AI뉴스!

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0723]모두에게 전하는 모두연 AI뉴스!

골빈해커 Chief Maker

머신러닝(AI) 모델 공개시에 이제 “Open Weight” 이라는 표현이 보편적으로 쓰이게 된 것 같네요.

서진호 sr. Presales Solution Architect, HPC&AI

<데이터브릭스, DBRX 범용 모델 소스로 공개>

주간 인기 TOP 10

골빈해커 Chief Maker

앞으로의 코테는 설명을 주고 코드를 짜라고 하는 것이 아니라, 코

장홍석 스페이스오디티 부대표/CPO

< 일 잘하는 PM은 문제의 ‘이름’부터 정의한다 >

Arawn Park Senior Engineer & Engineering Lead

자바 25를 사용해야 하는 이유

석민 커리어 코치

효과적인 경력 기술 가이드

레드버스백맨 리서처 앤 라이터

⟪통계청 2024년 생활시간조사로 본 7가지 핵심 데이터⟫

psmon 웹노리라이터

PRD분석 AI툴

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

📈 성과지표(KPI), 이렇게 설정하고 관리합니다

전민우 백엔드개발자

기능 정의의 중요성

달레 Apollo GraphQL Software Engineer

📊 스택 오버플로우 2025년 개발자 설문조사 결과 💡

박세호 피저블 랩 프로덕트 매니저

실제로 동작하는 PRD란

[0723]모두에게 전하는 모두연 AI뉴스!

댓글 0

함께 읽은 게시물

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

제가 쓴 "요즘 AI 에이전트 개발"이 출간 예정입니다!

‘망했다’는 순간에 우주 제일의 기회가 있다

비슷한 게시물

주간 인기 TOP 10

추천 프로필