허깅페이스에 0324 신규버전이 올라왔습니다.
벤치마크도 바로 등장했는데요. Sonnet 3.7 이 대부분의 모델을 제치고 우수한 성능을 보여줬는데 이를 따라잡는 수준이라니 놀랍습니다.
해당 벤치마크는 공간 안에서 겹치지 않게 공 튀기기나, 화성 궤도 시뮬레이션 같은 조금 더 복잡한 문제를 제시했네요. 벤치 내용도 재미있어서 공유합니다.
Deepseek V3 0324
https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
Kcores llm arena
https://github.com/KCORES/kcores-llm-arena/blob/main/benchmark-ball-bouncing-inside-spinning-heptagon/README.md
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2025년 3월 25일 오전 12:40