Weights & Bias에서 공개한 한국어 LLM 리더보드!

Weights & Bias에서 한국어 LLM 리더보드를 공개했습니다.

체감상 Claude 3.5 Sonnet이 더 괜찮다고 생각해서, 자주 쓰고 있는데, gpt-4o가 더 성능이 좋다는 결과네요. 그리고 오픈소스 모델에서는 Qwen2.5가 상위에 랭크된 것이 인상적입니다.


https://wandb.ai/wandb-korea/llm-leaderboard3/reports/W-B-Korean-LLM-Leaderboard-v3--Vmlldzo5NTM4MjU0

Horangi: W&B Korean LLM Leaderboard 3

W&B

Horangi: W&B Korean LLM Leaderboard 3

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 11월 12일 오전 2:02

댓글 0