Weights & Bias에서 공개한 한국어 LLM 리더보드!

Weights & Bias에서 한국어 LLM 리더보드를 공개했습니다.

체감상 Claude 3.5 Sonnet이 더 괜찮다고 생각해서, 자주 쓰고 있는데, gpt-4o가 더 성능이 좋다는 결과네요. 그리고 오픈소스 모델에서는 Qwen2.5가 상위에 랭크된 것이 인상적입니다.


https://wandb.ai/wandb-korea/llm-leaderboard3/reports/W-B-Korean-LLM-Leaderboard-v3--Vmlldzo5NTM4MjU0

Horangi: W&B Korean LLM Leaderboard 3

W&B

Horangi: W&B Korean LLM Leaderboard 3

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 11월 12일 오전 2:02

댓글 0

    함께 읽은 게시물

    애플의 차세대(ㅋㅋ) 디자인인 Liquid Glass는 반투명 스타일이 눈에 확 들어와서 그 부분만 많이 회자되는데, 그보다 Liquid 부분이 큰 축이라는 것도 중요함.


    액체의 움직임을 모방한 마이크로 인터렉션을 인터페이스 전반에 적용한 것인데, 이건 직접 보기 전엔 알기 어려운거라 꽤 기대가 됨.


    Kotlin의 Scope 함수 정리

    K

    ... 더 보기

    Kotlin의 Scope 함수 정리

    www.daleseo.com

    Kotlin의 Scope 함수 정리


    구현패턴으로 DB사용비용을 10배줄이기

    ... 더 보기

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

    GitHub

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

     • 

    댓글 1 • 저장 29 • 조회 2,349


    [광고] 다음 직무 채용 예정입니다.


    - 프러덕트/사업 기획 1인

    - 프러덕트 디자인 1인

    ... 더 보기

    노션 템플릿들을 만들면서 적는 회고

    ... 더 보기