Claude 3 Opus가 38%밖에 해결하지 못했던 Anthropic의 내부 에이전트 코딩/추론 벤치마크에서 Claude 3.5 Sonnet은 문제의 64%를 해결했다고 하네요.


38% -> 68%로의 개선은 정말 어마어마한 수치인데요. 50%를 넘는다는 것은 동전 던지기를 넘어선다는 것이기 때문에 매우 의미가 큽니다.


무엇보다 코딩 어시스턴트의 능력이 급격히 좋아지겠네요. 빨리 써봐야겠습니다. 🤩

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 6월 20일 오후 3:28

댓글 0

    함께 읽은 게시물

    제가 리드하고 있는 조직(당근마켓 커뮤니티실)에서 백엔드 엔지니어를 채용 중이에요.


    커뮤니티실에는 동네 이웃들의 이야기와 정보를 공유하는 동네생활팀, 이웃 간의 취미와 관심사를 연결하는 모임팀, 그리고 아파트 단지 생활을 더 편리하고 즐겁게 만들어 줄 단지팀이 있어요. 지금 내 동네에서 일어나고 있는 일들을 더 쉽게 즐기고 공유할 방법들을 찾는 일이라면 무엇이든 도전하여 실행에 옮겨요. 만드는 사람이 불편할수록 쓰는 사람은 편하다는 믿음으로 도전적인 문제를 풀어나갈 분과 함께하고자 해요.

    ... 더 보기

    조회 448


    고난이 사람을 키운다

    태초에 모든 동물은 바다에서 살았다. 바다가 동물이 살기 좋은 환경이었던 것이다. 그런데, 동물 사이에 먹이 사슬이 형성되었고, 힘이 없는 동물들은 척박한 곳으로 밀려났다. 그곳이 바로 강이다. 처음에는 강에서 살기 힘들었지만, 성공적으로 적응하는 동물들이 생겨났고, 그래서 강에도 생태계가 형성되었다.

    ... 더 보기