현존 최고 LLM은 앤스로픽의 클로드 3.5 소네트, 평가 by 갈릴레이

GenAI 평가를 진행하는 미국 스타트업 Galileo에 따르면, 현재 가장 성능 좋은 LLM은 Anthropic의 클로드 3.5 소네트라고 합니다.


성능, 가성비, 오픈소스 모델 등 다양한 범주로 모델들을 비교 평가 및 추천하고 있는데요,

  • ‘가장 성능이 좋은 모델’에는 앤트로픽에 클로드 3.5 소네트

  • ‘비용 대비 최고의 성능’ 분야는 구글의 ‘제미나이 1.5 플래시’

  • ‘가장 우수한 오픈소스 모델’은 알리바바의 ‘큐원2 72B’가 꼽혔네요


컨텍스트 길이에 따른 평가에서는

  • 짧은 컨텍스트(5000 토큰 이하, 폐쇄형) 클로드 3.5 소네트

  • 짧은 컨텍스트(5000 토큰 이하, 오픈소스) 메타의 라마3-70b

  • 중간 컨텍스트(5000~2만5000 토큰, 폐쇄형) 제미나이 1.5 플래시

  • 중간 컨텍스트(5000~2만5000 토큰, 오픈소스) 큐원 1.5-32B

  • 긴 콘텍스트(4만~10만 토큰) 클로드 3.5 소네트

와 같이 평가되었습니다.


하지만, 이러한 평가는 모델이 업데이트 되면서 계속 바뀌겠죠 ㅎㅎ


https://biz.chosun.com/it-science/ict/2024/08/01/J5B4YCRXTZDTPFUHXH4HGOFDMM/?utm_source=naver&utm_medium=original&utm_campaign=biz

"가장 성능 좋은 LLM은 앤트로픽 '클로드 3.5 소네트'...구글·메타·알리바바도 성능↑"

조선비즈

"가장 성능 좋은 LLM은 앤트로픽 '클로드 3.5 소네트'...구글·메타·알리바바도 성능↑"

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 8월 3일 오후 1:49

 • 

저장 3조회 1,094

댓글 0

    함께 읽은 게시물

    스트레스를 잘 관리하면서 건강하게 살아가고 싶다면, 우선 살아있는 한 우리가 해야 할 일들은 영원히 없어지지 않을 것이므로, 해야 할 일을 100% 해내면서 할 일 목록을 완전히 없애는 데 많은 노력을 들이기보다는 70% 정도만 해내도 만족할 필요가 있다.

    ... 더 보기

    [박진영의 사회심리학]스스로 만들어 내는 스트레스

    m.dongascience.com

    [박진영의 사회심리학]스스로 만들어 내는 스트레스

    [일터의 근육] 컬리 일잘러들의 공통점

    '

    ... 더 보기

    내 옆 일 잘하는 동료가 가진 것

    Brunch Story

    내 옆 일 잘하는 동료가 가진 것

    < 쿠팡의 창업자를 직접 보며 배운 것: 리더의 크기가 전부다 >

    1

    ... 더 보기

     • 

    댓글 1 • 저장 21 • 조회 1,667


    < 서비스를 중독성 있게 만드는 결정적 원리 >

    1. 진통제이면서 비타민이어야 한다.

    ... 더 보기

    테헤란로 소진언니 커리어 코칭 l 직장생활 13년차, 30대 환승이직!

    ... 더 보기

    이력서에 쓰는 경험

    

    ... 더 보기