Claude 3 Opus가 38%밖에 해결하지 못했던 Anthropic의 내부 에이전트 코딩/추론 벤치마크에서 Claude 3.5 Sonnet은 문제의 64%를 해결했다고 하네요.


38% -> 68%로의 개선은 정말 어마어마한 수치인데요. 50%를 넘는다는 것은 동전 던지기를 넘어선다는 것이기 때문에 매우 의미가 큽니다.


무엇보다 코딩 어시스턴트의 능력이 급격히 좋아지겠네요. 빨리 써봐야겠습니다. 🤩

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 6월 20일 오후 3:28

댓글 0

    함께 읽은 게시물

    이 글 하나면 끝, SQL 추천 책부터 코테 노하우까지 완전 정복하기

    ... 더 보기

    이 글 하나면 끝, SQL 입문부터 코딩테스트까지 완전 정복하기

    datarian.io

    이 글 하나면 끝, SQL 입문부터 코딩테스트까지 완전 정복하기

    📊 스택 오버플로우 2025년 개발자 설문조사 결과 💡

    1

    ... 더 보기

    2025 Stack Overflow Developer Survey

    survey.stackoverflow.co

    2025 Stack Overflow Developer Survey

    App size 다이어트 시키기 🍣

    i

    ... 더 보기

    Diet for iOS App size (feat. App Thinning)

    iOYES

    Diet for iOS App size (feat. App Thinning)

     • 

    저장 3 • 조회 1,455


    혹시 Claude 나 cursor 등 AI 로 개발하실 때
    뭔가 AI 스러운 뻔한 디자인 때문에

    ... 더 보기

    LinkedIn

    www.linkedin.com

    LinkedIn

    첫 회사보다 중요한 것

    ... 더 보기

    - YouTube

    undefined

     - YouTube

     • 

    저장 39 • 조회 2,480


    자바 25를 사용해야 하는 이유

    ... 더 보기

    곧 출시될 자바 25는 가능한 빨리 도입하세요

    kr.linkedin.com

    곧 출시될 자바 25는 가능한 빨리 도입하세요

     • 

    저장 19 • 조회 2,398