Claude Haiku >= GPT-4 ?

Claude Haiku가 GPT-4와 동일하거나 그 이상이라는 leaderboard 결과가 나왔습니다.

https://huggingface.co/.../lmsys/chatbot-arena-leaderboard


LMSYS Chatbot Arena는 인간 유저가 질문을 하면 2개의 랜덤한 LLM이 답변을 하고, 이에 대해 선호를 매기는 방식으로 측정됩니다.

Opus가 GPT4를 넘어설 것이라는 것까지는 예상이 되었는데, Sonnet 뿐 아니라 Haiku까지 GPT4 이상의 성적을 보일 것이라고는 예상하지 못했네요.


비용을 고려한다면 Haiku의 매력도가 엄청 올라간 것 같습니다!

아래의 사이트에서 비교해보니, 비용이 30배~60배 정도 차이가 나네요.

https://context.ai/compare/gpt-4-0613/claude-3-haiku


더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 3월 27일 오전 5:42

댓글 0

    함께 읽은 게시물

    지원자 예의 vs 기업 갑질? #면접 #탈락사유

    ... 더 보기


    티오더는 투자 유치라는 입장을 고수하고 있다. 지난 4월 투자 유치 자문사로 회계법인인 삼일PwC를 선정했다고 밝힌 바 있다. 또다른 IB 업계 관계자는 “투자 유치라 하더라도 창업자가 지분 일부를 매각하고 신주가 대거 발행되면 경영권이 바뀔 수 있다”고 설명했다.

    ... 더 보기

    KT, 테이블 오더 서비스 티오더 인수 검토

    조선비즈

    KT, 테이블 오더 서비스 티오더 인수 검토

    전략적 입사 지원

    ... 더 보기

     • 

    저장 18 • 조회 1,312


    < 당신은 몸의 신호를 믿나요, 시계의 숫자를 믿나요? >

    1. 시계로 인해 사람들이 배고픔에 대한 자신의 경험을 의심하고 시계의 지시를 따르게 된다. 시계가 사용자가 경험하는 새로운 물리적 현실을 만들어냈다.

    ... 더 보기

    기업을 선택하는 기준

    

    ... 더 보기