현존 최고 LLM은 앤스로픽의 클로드 3.5 소네트, 평가 by 갈릴레이
GenAI 평가를 진행하는 미국 스타트업 Galileo에 따르면, 현재 가장 성능 좋은 LLM은 Anthropic의 클로드 3.5 소네트라고 합니다. 성능, 가성비, 오픈소스 모델 등 다양한 범주로 모델들을 비교 평가 및 추천하고 있는데요, * ‘가장 성능이 좋은 모델’에는 앤트로픽에 클로드 3.5 소네트 * ‘비용 대비 최고의 성능’ 분야는 구글의 ‘제미나이 1.5 플래시’ * ‘가장 우수한 오픈소스 모델’은 알리바바의 ‘큐원2 72B’가 꼽혔네요 컨텍스트 길이에 따른 평가에서는 * 짧은 컨텍스트(5000 토큰 이하, 폐쇄형) 클로드 3.5 소네트 * 짧은 컨텍스트(5000 토큰 이하, 오픈소스) 메타의 라마3-70b * 중간 컨텍스트(5000~2만5000 토큰, 폐쇄형) 제미나이 1.5 플래시 * 중간 컨텍스트(5000~2만5000 토큰, 오픈소스) 큐원 1.5-32B * 긴 콘텍스트(4만~10만 토큰) 클로드 3.5 소네트 와 같이 평가되었습니다. 하지만, 이러한 평가는 모델이 업데이트 되면서 계속 바뀌겠죠 ㅎㅎ https://biz.chosun.com/it-science/ict/2024/08/01/J5B4YCRXTZDTPFUHXH4HGOFDMM/?utm_source=naver&utm_medium=original&utm_campaign=biz