Horangi: W&B Korean LLM Leaderboard 3
W&B
Weights & Bias에서 한국어 LLM 리더보드를 공개했습니다.
체감상 Claude 3.5 Sonnet이 더 괜찮다고 생각해서, 자주 쓰고 있는데, gpt-4o가 더 성능이 좋다는 결과네요. 그리고 오픈소스 모델에서는 Qwen2.5가 상위에 랭크된 것이 인상적입니다.
https://wandb.ai/wandb-korea/llm-leaderboard3/reports/W-B-Korean-LLM-Leaderboard-v3--Vmlldzo5NTM4MjU0
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 11월 12일 오전 2:02