MistralAI - 최고의 성능까지 갖춘 최초의 오픈소스 LLM

현재 X (트위터) 에서 가장 많이 언급되고 있는 키워드가 아마도 Mistral이 아닐까 싶은데요.
아마도 Meta의 Llama2 가 이끌고 있던 오픈 LLM 진영에 새로운 돌풍이 일고 있는 것 같습니다.

현재 공개된 모델은 73억(7.3B) 매개변수를 가진 Mistral 7B 입니다. 
LLM으로는 처음으로 Apache 2.0 라이선스로 공개하였으며, 제한 없이 사용할 수 있습니다.

참고로 Meta의 Llama는 처음에 GPLv3 로 공개했다가, 사용 제약등으로 인해 현재는 LLAMA 2 COMMUNITY LICENSE 로 오픈소스로 분류되진 않고 있습니다. (LLaMa 2 라이선스는 오픈 소스가 아닙니다.)

Mistral 7B는 사용 제한도 없는데다가 성능까지도 획기적으로 올라간 벤치마크도 공개했습니다.
비슷한 매개변수를 가진 Llama2 7B를 뛰어넘어, 보다 더 큰 규모의 Llama 2 13B 도 아닌 Llama 34B와 동등하다고 주장합니다.


보다 자세한 벤치마크 보기 : https://mistral.ai/news/announcing-mistral-7b/

이와 같은 놀라운 성능 뒤에는 더 빠른 추론을 위해 GQA(Grouped-query attention)를 사용했으며, 슬라이딩 윈도우 어텐션(SWA)을 사용하여 더 적은 비용으로 더 긴 시퀀스를 처리하는데 비결이 있었다고 합니다.


Mistral 7B 는 어떤 클라우드 (AWS, GPC, Azure) 에서도 vLLM 추론서버 및 skypilot 을 이용해 사용 할 수 있습니다. HuggingFace에서도 사용해볼 수 있습니다. 저는 아직 해보지 못했는데 M1 이상의 맥북에서도 잘 동작한다고 합니다. 로컬에서 GPT3.5와 비슷한 결과를 받을 수 있다는 평가. 관심있으신분들은 한번 해보세요. 모델은 llama.cpp에 의해 지원되기 때문에 macOS의 FreeChat에서 작동한다고 하네요. (GitHub)


Mistral 7B를 만든 주역은 프랑스의 스타트업으로 창업한지 4주만인 지난 6월 1440억 시드 라운드로 투자를 받았으며, 창립 멤버들이 딥마인드 출신들인 것으로 알려져 있습니다.


MistralAI - 최고의 성능까지 갖춘 최초의 Apache 2.0 라이선스 LLM 모델 등장 (tistory.com)

Tistory

Tistory

Tistory

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 10월 5일 오후 6:37

 • 

저장 8조회 3,299

댓글 0

    함께 읽은 게시물

    여러분 PostgreSQL 프로시저는 Python, JavaScript은 물론 Perl, Java, Lua 등도 사용할 수 있답니다~* 대부분 구식🤭 MySQL만 쓰셔서 모르시겠지만.. (도망간다)


    < 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

    1

    ... 더 보기

     • 

    댓글 1 • 저장 11 • 조회 1,237



    <👩🏻‍💻 신규 개발자가 입사 첫 달에 해야 할 7가지>

    어느 환경에서든 첫인상은 중요합니다. 첫인상으로 인해 생긴 이미지는 추후에 쉽게 바뀌지 않는데요, 회사에서도 예외는 아닙니다. 입사 초기에 보이는 모습에 따라 ‘실력자’라는 인상을 줄 수도, ‘일 못하는 사람’으로 낙인찍힐 수도 있죠. 입사 첫 달은 이러한 첫인상을 결정짓는 중요한 시기입니다. 더 나아가서는 이 시기가 앞으로 이 회사에서의 성공을 좌우할 수도 있어요. 신규 개발자가 새 직장에서 첫 시작을 잘 끊기 위해서 해야 할 7가지 일을 선정해 보았습니다! 1️⃣ 상사의 기대치 파악하기 입사 초반에는 ... 더 보기

    신규 개발자가 입사 첫 달에 해야 할 7가지

    Brunch Story

    신규 개발자가 입사 첫 달에 해야 할 7가지

     • 

    댓글 5 • 저장 621 • 조회 18,140


    이직의 조건

    

    ... 더 보기

    간밤에 또 빅 AI 업데이트가 있었군요. Claude 4 Opus, Sonnet 패밀리가 발표되었습니다.


    성능이나 다양한 능력이 향상되었고, 트렌드에 맞게(?) 소프트웨어 개발 성능이 또 크게 올랐습니다.


    ... 더 보기