Deepseek V3 업데이트로 Sonnet 3.7과 비등해지다?

허깅페이스에 0324 신규버전이 올라왔습니다.

벤치마크도 바로 등장했는데요. Sonnet 3.7 이 대부분의 모델을 제치고 우수한 성능을 보여줬는데 이를 따라잡는 수준이라니 놀랍습니다.


해당 벤치마크는 공간 안에서 겹치지 않게 공 튀기기나, 화성 궤도 시뮬레이션 같은 조금 더 복잡한 문제를 제시했네요. 벤치 내용도 재미있어서 공유합니다.


Deepseek V3 0324
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324


Kcores llm arena

https://github.com/KCORES/kcores-llm-arena/blob/main/benchmark-ball-bouncing-inside-spinning-heptagon/README.md




더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2025년 3월 25일 오전 12:40

댓글 0