현존 최고 LLM은 앤스로픽의 클로드 3.5 소네트, 평가 by 갈릴레이

GenAI 평가를 진행하는 미국 스타트업 Galileo에 따르면, 현재 가장 성능 좋은 LLM은 Anthropic의 클로드 3.5 소네트라고 합니다.


성능, 가성비, 오픈소스 모델 등 다양한 범주로 모델들을 비교 평가 및 추천하고 있는데요,

  • ‘가장 성능이 좋은 모델’에는 앤트로픽에 클로드 3.5 소네트

  • ‘비용 대비 최고의 성능’ 분야는 구글의 ‘제미나이 1.5 플래시’

  • ‘가장 우수한 오픈소스 모델’은 알리바바의 ‘큐원2 72B’가 꼽혔네요


컨텍스트 길이에 따른 평가에서는

  • 짧은 컨텍스트(5000 토큰 이하, 폐쇄형) 클로드 3.5 소네트

  • 짧은 컨텍스트(5000 토큰 이하, 오픈소스) 메타의 라마3-70b

  • 중간 컨텍스트(5000~2만5000 토큰, 폐쇄형) 제미나이 1.5 플래시

  • 중간 컨텍스트(5000~2만5000 토큰, 오픈소스) 큐원 1.5-32B

  • 긴 콘텍스트(4만~10만 토큰) 클로드 3.5 소네트

와 같이 평가되었습니다.


하지만, 이러한 평가는 모델이 업데이트 되면서 계속 바뀌겠죠 ㅎㅎ


https://biz.chosun.com/it-science/ict/2024/08/01/J5B4YCRXTZDTPFUHXH4HGOFDMM/?utm_source=naver&utm_medium=original&utm_campaign=biz

"가장 성능 좋은 LLM은 앤트로픽 '클로드 3.5 소네트'...구글·메타·알리바바도 성능↑"

조선비즈

"가장 성능 좋은 LLM은 앤트로픽 '클로드 3.5 소네트'...구글·메타·알리바바도 성능↑"

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 8월 3일 오후 1:49

 • 

저장 3조회 1,098

댓글 0

    함께 읽은 게시물

    어려움을 극복하는 힘

    ... 더 보기

    < 저는 책을 끝까지 읽지 않습니다 >

    1

    ... 더 보기

    쉬운 길

    

    ... 더 보기

    < 당신이 바쁜데도 성과가 없는 이유 >

    1. '바쁘다'는 건 열심히 많은 일을 하고 있다는 뜻이다.

    ... 더 보기

    프리미어리그를 비롯한 유럽 축구리그에는 한국에서 뛰는 모든 축구 선수들의 연봉을 합한 것보다 수십 배가 넘는 돈을 버는 선수들이 즐비하다. 이런 일이 왜 가능할까?

    ... 더 보기

    [허연의 책과 지성] 1:99 양극화 사회선 결국 1%도 불행해진다 - 매일경제

    매일경제

    [허연의 책과 지성] 1:99 양극화 사회선 결국 1%도 불행해진다 - 매일경제

    리더의 역할은 방향을 제시하고 조직을 이끄는 것이다. 의사결정을 내리는 데 지나치게 시간을 끌거나 아예 결정을 피하는 리더가 있다. 이런 리더가 있는 조직은 점차 무기력해지고 성장의 기회를 놓치게 된다. 여러 가지 단점이 있지만, 가장 큰 단점은 직원들을 게으르게 만든다.

    ... 더 보기

    [명대성의 소통 본색] 결정을 미루는 리더가 조직에 미치는 영향

    한국강사신문

    [명대성의 소통 본색] 결정을 미루는 리더가 조직에 미치는 영향

     • 

    저장 6 • 조회 746