Gemma2 2B 모델이 공개되었다고 합니다.


동일 파라미터 대비 최고 성능이라는데, chatbot arena score를 보면 GPT 3.5 Turbo를 이겼습니다.

2B 모델로 이게 되는군요.

LLaMA 3.1 8B 보다는 score가 낮지만, 파라미터 수가 1/4 인 것을 생각하면 정말 놀랍습니다.


Google Colab의 무료 버전 T4 GPU에서도 동작할 수 있을 정도로 작다고 (자랑)하네요.

(It's even small enough to run on the free tier of T4 GPUs in Google Colab)


on-device AI가 성큼 다가오는게 실감이 나네요.


- link: https://developers.googleblog.com/en/smaller-safer-more-transparent-advancing-responsible-ai-with-gemma/

- hugging face: https://huggingface.co/google/gemma-2-2b

Smaller, Safer, More Transparent: Advancing Responsible AI with Gemma

Googleblog

Smaller, Safer, More Transparent: Advancing Responsible AI with Gemma

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 8월 1일 오전 2:49

댓글 0

    함께 읽은 게시물

    백로그의 재해석

    백로그는 우리가 짊어질 필요가 없는 무거운 것이다. 수십개에서 시작해서 결국 수백개에 이르는 우리 모두 절대 할 일이 없어보이는 태스크들이다. 쌓여가는 무더기는 실제로는 그렇지 않음에도 우리가 늘 뒤쳐져가는 느낌을 준다. 누군가가 한분기 전에 중요하다고 생각했던 아이디어라고 할지라도, 그게 우리가 매번 들여다보고 또 볼 필요가 있다는 걸 의미하지 않는다. 백로그는 엄청난 시간 낭비를 초래한다. 지속적으로 리뷰하고 우선순위를 매기는 일들이 지금 정말 중요한 일을 진행하는 것을 방해한다.


    MCP는 기술적으로는 거의 순수하게 Function Calling의 Thin Wrapper에 불과함.


    다만, 현재 대부분의 애플리케이션이 Function Calling을 지원하지 않는 상태라, LLM에 Function Calling을 주입할 수 있는 서버를 쉽게 만들 수 있는 라이브러리를 제공했던 것이 MCP를 확산시키는 데에 크게 기여를 한 것.


    ... 더 보기

    [서평]일잘러의 비밀, 챗GPT와 GPTs로 나만의 AI 챗봇 만들기

    ... 더 보기

    사용자가 공유한 콘텐츠

    www.hanbit.co.kr

    사용자가 공유한 콘텐츠

    결제 서비스 기획해야 하는 분들 있으실까요?

    ... 더 보기

    결제 서비스, 이건 알아야 해요

    팁스터

    결제 서비스, 이건 알아야 해요

    Electron에 대해 사람들이 잘못 알고 있는 것들

    ... 더 보기

    (번역) Electron에 대해 사람들이 잘못 알고 있는 것들

    velog.io

    (번역) Electron에 대해 사람들이 잘못 알고 있는 것들

     • 

    저장 24 • 조회 3,364


    코드 편집기를 만들어보신 적 있나요?

    ... 더 보기

    - YouTube

    youtu.be

     - YouTube