[0218]모두에게 전하는 모두연 AI뉴스!

  • 일론 머스크, Grok 3 공개! "역대 최고 AI" 자부심

일론 머스크가 X에서 Grok 3라는 새로운 AI 모델을 발표했습니다. Grok 3는 이전 버전보다 훨씬 똑똑하며, 추론, 심층 검색, 이미지 생성 및 코딩 기능이 향상되었습니다. 일론 머스크는 Grok 3가 아직 완벽하지 않으며 앞으로 몇 주 동안 개선될 것이라고 말했습니다. Grok 3는 챗봇 아레나에서 'Chocolate'이라는 이름으로 테스트되었고 최고성능에 도달했으며 곧 API도 출시될 예정입니다. 많은 사람들이 Grok 3의 성능에 기대를 하고 있으며, 특히 이미지 생성 기능과 코딩 기능이 다른 추론모델들보다도 뛰어나다고 합니다. Grok 3는 딥 서치 기능을 통해 웹 검색도 가능하며, 이는 Perplexity와 유사합니다. 전반적으로 Grok 3는 AI 분야에서 큰 발전이며, 앞으로 어떤 영향을 미칠지 기대됩니다.


https://www.youtube.com/watch?v=AGtQKifKVj0&t=4s


  • LLaDA: 새로운 디퓨전 모델, LLM 판도를 뒤흔들다!

이 논문에서는 사전 훈련 및 지도 미세 조정(SFT) 패러다임에서 처음부터 훈련된 디퓨전 모델인 LLaDA를 소개합니다. LLaDA는 순방향 데이터 마스킹 프로세스와 바닐라 트랜스포머로 매개변수화된 역방향 프로세스를 통해 마스크된 토큰을 예측하여 분포를 모델링합니다. LLaDA는 광범위한 벤치마크에서 강력한 확장성을 보여주며 자체 구축된 ARM 기준선을 능가합니다. 특히 LLaDA 8B는 컨텍스트 내 학습에서 LLaMA3 8B와 같은 강력한 LLM과 경쟁이 되며 SFT 후에는 다중 턴 대화와 같은 사례 연구에서 인상적인 명령어 준수 기능을 보여줍니다. 이러한 결과는 디퓨전 모델이 autoregressive modeling의 실행 가능하고 유망한 대안임을 입증하여 위에서 언급한 주요 LLM 기능이 본질적으로 AutoRegressive Modeling과 관련이 있다는 가정에 의문을 제기합니다.


https://huggingface.co/papers/2502.09992


2017년부터 가치를 이어온 AI 명문
아이펠리서치 온라인13기 사전등록 : https://bit.ly/4jzwrSS

- YouTube

www.youtube.com

 - YouTube

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 2월 18일 오전 6:57

댓글 0

    함께 읽은 게시물

    작은 브랜드는 이걸 보셔야 해요.

    브랜드와 고객 사이에 ‘접점’이 있어요.
    채널로는 웹, SNS, 오프라인,광고, 디지털 채널들.

    ... 더 보기

    많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.

    ... 더 보기

     • 

    저장 10 • 조회 1,430


    업계에 필요한 사람이 되자

    ... 더 보기

    업계에 필요한 사람이 되자

    Brunch Story

    업계에 필요한 사람이 되자

     • 

    저장 7 • 조회 1,246


    바이브 코딩이야말로 진정한 애자일이 아닌가.

    조회 2,884


    한시간 반만에 Cursor로 만든 개발서적 경매서비스 후기

    ... 더 보기

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

    jasonkang14.github.io

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

     • 

    저장 38 • 조회 3,825


    요약하며 읽기

    ... 더 보기

    11화 요약하며 읽기

    Brunch Story

    11화 요약하며 읽기