Gemini Pro 2.5의 프로그래밍 성능은 최상위?
Deepseek 업데이트 발표에 이어 제미나이 Pro 2.5도 공개되면서, 평균적인 성능이 점점 상향되고 있다는 게 확실히 체감됩니다. Cursor와 유사한 커맨드라인 코딩 에이전트 툴인 Aider의 벤치마크에서도 최상위권을 차지한 걸 보면, 점점 더 강력한 모델들이 나오고 있는 게 흥미롭네요. 제미나이 Pro 2.5를 구글 스튜디오에서 바로 사용해볼 수 있어서 간단히 테스트를 진행해봤는데요. * "제미나이 Pro 2.5에 대해 설명해줘" → 약 1분 정도의 Thinking 과정을 거친 후, 제미나이 1.5 관련 정보를 알려줬습니다. 학습 데이터가 2024년 6월까지 반영된 것으로 보입니다. * "사과를 영어로" → 약 5초의 Thinking 후 "apple"이라는 답변이 나왔습니다. 흥미로운 점은, 최신 모델들이 질문의 난이도를 스스로 판단하는 기능을 추가했다는 겁니다. 따로 모델에Thinking 이라는 명칭이 붙어 있지 않음에도, 질문을 분류하고 사고하는 방식으로 동작하는 게 인상적입니다. 결국 모델을 전환하지 않아도 되는 편의성 때문에 일반 소비자에겐 이런 접근 방식이 훨씬 유리할 수밖에 없고, 질문을 제대로 분류하는 기술만 정교해진다면 생각의 깊이를 알아서 판단하는 모델들이 보편화될 가능성이 커 보입니다. 구글 스튜디오 https://aistudio.google.com