메모리 최적화된 로컬 AI 모델을 사용해봅시다. - Gemma3 QAT

QAT는 Quantization Aware Trained의 약어이며, 양자화 하고 있다는 것을 인지시키면서 훈련하는 것을 말합니다. 원본 F16 모델과의 성능차이가 거의 없는 수준으로 3배 이상 메모리 요구치를 낮춘 모델입니다. (이미지 참고, 출처 구글 딥마인드)


ollama에도 정식으로 추가되어 간편하게 사용해 볼 수 있습니다.

1B

ollama run gemma3:1b-it-qat

4B

ollama run gemma3:4b-it-qat

12B

ollama run gemma3:12b-it-qat

27B

ollama run gemma3:27b-it-qat


대부분의 로컬 모델 체험기는 성능 손실이 다소 발생하는 Q4모델을 기준으로 한 것인 만큼, 원본에 가까운 성능이라 하니 기대가 되네요.

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2025년 4월 19일 오전 12:40

댓글 0

    함께 읽은 게시물

    리트코드 102. Binary Tree Level Order Traver

    ... 더 보기

    Binary Tree Level Order Traversal | 알고달레

    알고달레

    Binary Tree Level Order Traversal | 알고달레

    👋 LLM 활용에 도움이 되는 가이드 모음

    ✅️Prompting Guide 101 by Google : https://lnkd.in/d8UwPWeN

    ... 더 보기

     • 

    저장 10 • 조회 768


    데이터 분석 프로젝트 왜 이렇게 어려울까요?

    월간 데이터리안 2월 세미나, “데이터 분석가 어떻게 준비해야 할까?” ⏰ 2/14(화) 저녁 7시 (오늘 마감! 다시보기 제공) 1️⃣ 데이터 분석 프로젝트, 왜 이렇게 어려울까 - 데이터리안 데이터 분석가 김민주님 2️⃣ 2022년 데이터 분석가 취업 이렇게 했습니다 - 스마트오더 플랫폼 데이터 분석가 이유진님 - 패션 플랫폼 데이터 분석가 유가연님 아래 질문들에 대한 현직자들의 답변이 궁금하다면, 지금 바로 세미나 신청하기 👉 https://bit.ly/3GmGcSN [ 지금까지 들어온 질문들 ] ✔ 이제 ... 더 보기

     • 

    저장 7 • 조회 2,070


    린 분석 방법론은 이제 끝인가요?

    페이스북에 Jonas Kim님이 올린 포스팅인데 린 분석 방법론에 대해 다시 한번 생각해보게 됩니다. 저는 린 분석 방법론이 끝물이라는 생각이 들지 않습니다. 현장에서는 이미 트래픽과 매출액이 디커플링되기 시작한 것도 길게보면 7~8년 된 일이고, 성장과 이익을 동시에 균형있게 움직이는 방법을 찾지 못하는 많은 제품과 서비스가 있을 뿐입니다. 지적한 바와 같이 원가, 비용등 재무적인 분석도 대단히 중요한 일이 되어 가는 시점에서 데이터 분석가와 마케터도 이에 맞춰 적응해야 할 시기라고 생각되네요. [... 더 보기

    사용자가 공유한 콘텐츠

    -

    사용자가 공유한 콘텐츠

    고기 먹었는데 연탄만 찍었네. 퐈이어!! 🔥

    조회 1,793