DeepSeek-R1-0528 버전 출시, 성능은?

DeepSeek이 최신 추론 모델인 R1-0528을 조용히 출시했습니다.

이번 업데이트의 가장 주목할 만한 점은 벤치마크 성능이 Gemini 2.5 Pro와 근접한 수준에 도달했다는 것입니다.

특히 수학 추론 벤치마크인 AIME 2025에서는 정확도가 70%에서 87.5%로 대폭 향상되어 OpenAI의 o3, Google의 최신 모델들과 경쟁할 수 있는 수준임을 입증했습니다.

흥미로운 것은 이와 함께 공개된 8B 파라미터 증류 모델인데요. 소형모델임에도 불구하고 굉장히 높은 벤치마크 수치를 보여주고 있습니다.

다만 30B 미만 모델들은 대부분 여전히 명령 이해도가 떨어지는 경향이 있어 참고용으로만 보는것이 바람직할것입니다.

이번 DeepSeek의 모델 공개가 또 한번 주목받는 이유는 이번에도 오픈소스로 모델을 제공하였다는 것인데요.

이는 OpenAI, Google, Anthropic 등 미국 빅테크 기업들이 막대한 자원을 투입해 개발한 프리미엄 모델들에 대한 일종의 청야전술로 볼 수 있을 것 같습니다.

물론 기술과 노하우는 여전히 남아있겠지만, 누구나 고성능 AI 모델을 서빙할 수 있고 진입장벽이 점점 낮아지게 되면, 기존 유료 AI 서비스 제공업체들의 단기적 수익 구조에 문제가 생길 수도 있을것으로 보입니다.

허깅페이스
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528


다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 5월 30일 오전 12:11

댓글 0

    함께 읽은 게시물

    고난이 사람을 키운다

    태초에 모든 동물은 바다에서 살았다. 바다가 동물이 살기 좋은 환경이었던 것이다. 그런데, 동물 사이에 먹이 사슬이 형성되었고, 힘이 없는 동물들은 척박한 곳으로 밀려났다. 그곳이 바로 강이다. 처음에는 강에서 살기 힘들었지만, 성공적으로 적응하는 동물들이 생겨났고, 그래서 강에도 생태계가 형성되었다.

    ... 더 보기

    제가 리드하고 있는 조직(당근마켓 커뮤니티실)에서 백엔드 엔지니어를 채용 중이에요.


    커뮤니티실에는 동네 이웃들의 이야기와 정보를 공유하는 동네생활팀, 이웃 간의 취미와 관심사를 연결하는 모임팀, 그리고 아파트 단지 생활을 더 편리하고 즐겁게 만들어 줄 단지팀이 있어요. 지금 내 동네에서 일어나고 있는 일들을 더 쉽게 즐기고 공유할 방법들을 찾는 일이라면 무엇이든 도전하여 실행에 옮겨요. 만드는 사람이 불편할수록 쓰는 사람은 편하다는 믿음으로 도전적인 문제를 풀어나갈 분과 함께하고자 해요.

    ... 더 보기

    조회 296