Deepseek V3 업데이트로 Sonnet 3.7과 비등해지다?
허깅페이스에 0324 신규버전이 올라왔습니다. 벤치마크도 바로 등장했는데요. Sonnet 3.7 이 대부분의 모델을 제치고 우수한 성능을 보여줬는데 이를 따라잡는 수준이라니 놀랍습니다. 해당 벤치마크는 공간 안에서 겹치지 않게 공 튀기기나, 화성 궤도 시뮬레이션 같은 조금 더 복잡한 문제를 제시했네요. 벤치 내용도 재미있어서 공유합니다. Deepseek V3 0324 https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 Kcores llm arena https://github.com/KCORES/kcores-llm-arena/blob/main/benchmark-ball-bouncing-inside-spinning-heptagon/README.md