백선환

AWS/ AIML Specialist

현존 최고 LLM은 앤스로픽의 클로드 3.5 소네트, 평가 by 갈릴레이

GenAI 평가를 진행하는 미국 스타트업 Galileo에 따르면, 현재 가장 성능 좋은 LLM은 Anthropic의 클로드 3.5 소네트라고 합니다.

성능, 가성비, 오픈소스 모델 등 다양한 범주로 모델들을 비교 평가 및 추천하고 있는데요,

‘가장 성능이 좋은 모델’에는 앤트로픽에 클로드 3.5 소네트
‘비용 대비 최고의 성능’ 분야는 구글의 ‘제미나이 1.5 플래시’
‘가장 우수한 오픈소스 모델’은 알리바바의 ‘큐원2 72B’가 꼽혔네요

컨텍스트 길이에 따른 평가에서는

짧은 컨텍스트(5000 토큰 이하, 폐쇄형) 클로드 3.5 소네트
짧은 컨텍스트(5000 토큰 이하, 오픈소스) 메타의 라마3-70b
중간 컨텍스트(5000~2만5000 토큰, 폐쇄형) 제미나이 1.5 플래시
중간 컨텍스트(5000~2만5000 토큰, 오픈소스) 큐원 1.5-32B
긴 콘텍스트(4만~10만 토큰) 클로드 3.5 소네트

와 같이 평가되었습니다.

하지만, 이러한 평가는 모델이 업데이트 되면서 계속 바뀌겠죠 ㅎㅎ

https://biz.chosun.com/it-science/ict/2024/08/01/J5B4YCRXTZDTPFUHXH4HGOFDMM/?utm_source=naver&utm_medium=original&utm_campaign=biz

"가장 성능 좋은 LLM은 앤트로픽 '클로드 3.5 소네트'...구글·메타·알리바바도 성능↑"

조선비즈

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 8월 3일 오후 1:49

•

저장 3 • 조회 1,098

함께 읽은 게시물

석민

커리어 코치

7월 6일

어려움을 극복하는 힘

지

댓글 1 • 저장 4 • 조회 858

장홍석

스페이스오디티 부대표/CPO

7월 6일

< 저는 책을 끝까지 읽지 않습니다 >

댓글 1 • 저장 8 • 조회 909

석민

커리어 코치

7일 전

쉬운 길

저장 5 • 조회 926

장홍석

스페이스오디티 부대표/CPO

3일 전

< 당신이 바쁜데도 성과가 없는 이유 >

1. '바쁘다'는 건 열심히 많은 일을 하고 있다는 뜻이다.

댓글 1 • 저장 6 • 조회 815

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

7일 전

프리미어리그를 비롯한 유럽 축구리그에는 한국에서 뛰는 모든 축구 선수들의 연봉을 합한 것보다 수십 배가 넘는 돈을 버는 선수들이 즐비하다. 이런 일이 왜 가능할까?

[허연의 책과 지성] 1:99 양극화 사회선 결국 1%도 불행해진다 - 매일경제

매일경제

저장 3 • 조회 574

Annette MJ Kim

사람과 조직의 동반 성장을 위해 일해요:D

6월 30일

리더의 역할은 방향을 제시하고 조직을 이끄는 것이다. 의사결정을 내리는 데 지나치게 시간을 끌거나 아예 결정을 피하는 리더가 있다. 이런 리더가 있는 조직은 점차 무기력해지고 성장의 기회를 놓치게 된다. 여러 가지 단점이 있지만, 가장 큰 단점은 직원들을 게으르게 만든다.

[명대성의 소통 본색] 결정을 미루는 리더가 조직에 미치는 영향

한국강사신문

•

저장 6 • 조회 746

비슷한 게시물

레드버스백맨 리서처 앤 라이터

《DeepSeek 창업자, 85년생 량원평 인터뷰》

HoJoong Kim Senior IT guy

마누스(Manus) AI

골빈해커 Chief Maker

Mistral Large 2 123B이 발표되었네요. Llama 3.1 이 발표된지 하루만인데요. 이번주는 고맙게도 도파민 주간으로 정했나봅니다. ㅋㅋ 아무튼 면면을 살펴보면,

골빈해커 Chief Maker

GPT-4o와 Claude 3.5 Sonnet를 실사용에서 비교해봤을 때도 Claude가 더 좋다. 예전에는 성능 지표 수준과는 다르게 실사용시에는 많이 떨어졌는데, 이제는 실사용

송요창 배민 프론트엔드 프로그래머

성능 좋고, 값싼 중국 AI 모델 연속 등장

닥터G UX 디자이너 & 리서처

6월 넷째주 IT News

주간 인기 TOP 10

강재상 스타트업 육성, Corprate Venturing, 사업, 커리어, 작가

회사 때려치고 사업이나 한번 해볼까?

K리그 프로그래머 커피한잔 개발자

클로드 코드 Max 한 달 사용 후기

전민우 백엔드개발자

회피를 해야 할까요? 방안을 찾아야 할까요?

유용우(요우) NAVER 백엔드 개발자

사용자가 아닌 개발자를 위한 웹 개발의 시대

이양일 NaverCloud 백엔드 개발자

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

김의중 프론트엔드 개발자

Next.js 앱을 쿠버네티스에 배포하기 (feat. ArgoCD

레드버스백맨 리서처 앤 라이터

⟪토스가 만든 리서치툴, TNS⟫

골빈해커 Chief Maker

‪요 기능의 일부를 바이브 코딩으로 만들려다가 실패했는데요. 그

JOSH 솔로프리너 CEO

국내 바이브코딩 시장을 혼자 독점하고 계신 커서맛피아님을 인터뷰했

이유진 우아한 형제들 프로덕트 디자이너

생산성 수치심 (Productivity Shame) 극복하기 (1

현존 최고 LLM은 앤스로픽의 클로드 3.5 소네트, 평가 by 갈릴레이

댓글 0

함께 읽은 게시물

어려움을 극복하는 힘

< 저는 책을 끝까지 읽지 않습니다 >

쉬운 길

< 당신이 바쁜데도 성과가 없는 이유 >

비슷한 게시물

주간 인기 TOP 10

추천 프로필