Gemini Pro 2.5의 프로그래밍 성능은 최상위?

Deepseek 업데이트 발표에 이어 제미나이 Pro 2.5도 공개되면서, 평균적인 성능이 점점 상향되고 있다는 게 확실히 체감됩니다.

Cursor와 유사한 커맨드라인 코딩 에이전트 툴인 Aider의 벤치마크에서도 최상위권을 차지한 걸 보면, 점점 더 강력한 모델들이 나오고 있는 게 흥미롭네요.

제미나이 Pro 2.5를 구글 스튜디오에서 바로 사용해볼 수 있어서 간단히 테스트를 진행해봤는데요.

  • "제미나이 Pro 2.5에 대해 설명해줘" → 약 1분 정도의 Thinking 과정을 거친 후, 제미나이 1.5 관련 정보를 알려줬습니다. 학습 데이터가 2024년 6월까지 반영된 것으로 보입니다.

  • "사과를 영어로" → 약 5초의 Thinking 후 "apple"이라는 답변이 나왔습니다.

흥미로운 점은, 최신 모델들이 질문의 난이도를 스스로 판단하는 기능을 추가했다는 겁니다. 따로 모델에Thinking 이라는 명칭이 붙어 있지 않음에도, 질문을 분류하고 사고하는 방식으로 동작하는 게 인상적입니다.

결국 모델을 전환하지 않아도 되는 편의성 때문에 일반 소비자에겐 이런 접근 방식이 훨씬 유리할 수밖에 없고, 질문을 제대로 분류하는 기술만 정교해진다면 생각의 깊이를 알아서 판단하는 모델들이 보편화될 가능성이 커 보입니다.


구글 스튜디오
https://aistudio.google.com

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 3월 25일 오후 11:53

댓글 0

    함께 읽은 게시물

    🤖 최초의 AI 브라우저, Dia 직접 써봤습니다! 🌐

    ... 더 보기

    레몬베이스 팀의 스크럼 방법

    요즘 스타트업에서 스쿼드 조직으로 제품을 개발하는 경우가 많은데요. 대부분은 스프린트 단위로 개발을 진행하는 스크럼 방식을 채택하고 있는거 같습니다. 하지만 스크럼을 제대로 활용하지 못한다면 오히려 전보다 비효율적인 방식으로 일을 할 수도 있는데요. SaaS 스타트업인 레몬베이스 팀이 스크럼 과정을 개선한 회고 글이 있어 공유드립니다. 👮‍♀️ 과거의 스크럼 방식 1. 스프린트 시작 전에 PO가 기획서를 공유 2. 스프린트 시작과 동시에 자율적으로 티켓의 오너를 할당 3. 필요할 때 업무에 관련 있... 더 보기

    제품 스쿼드의 스크럼 프로세스 개선기 1부

    Medium

    제품 스쿼드의 스크럼 프로세스 개선기 1부

     • 

    저장 143 • 조회 5,224



    어려운 문제를 대하는 태도

    

    ... 더 보기

    제품을 빠르게 출시하는 8가지 방법

    ... 더 보기

    How to ship fast

    wrap text ↩

    How to ship fast

    Principe Engineer가 지향하는 가치와 기대

    Amazon에서 Principle Engineer가 가져야 할 가치와 기대에 대해 9지로 정의하였습니다. 모두 끄덕일 수 있는 내용이라 공감이 많이 되네요. 꼭 Priciple Engineer가 아니더라도 주니어일 때부터 지향해야 할 가치라고 생각됩니다.

    엔지니어가 가져야 할 자세

    Growth Ryan

    엔지니어가 가져야 할 자세