- YouTube
www.youtube.com
DeepSeek이 최신 추론 모델인 R1-0528을 조용히 출시했습니다.
이번 업데이트의 가장 주목할 만한 점은 벤치마크 성능이 Gemini 2.5 Pro와 근접한 수준에 도달했다는 것입니다.
특히 수학 추론 벤치마크인 AIME 2025에서는 정확도가 70%에서 87.5%로 대폭 향상되어 OpenAI의 o3, Google의 최신 모델들과 경쟁할 수 있는 수준임을 입증했습니다.
흥미로운 것은 이와 함께 공개된 8B 파라미터 증류 모델인데요. 소형모델임에도 불구하고 굉장히 높은 벤치마크 수치를 보여주고 있습니다.
다만 30B 미만 모델들은 대부분 여전히 명령 이해도가 떨어지는 경향이 있어 참고용으로만 보는것이 바람직할것입니다.
이번 DeepSeek의 모델 공개가 또 한번 주목받는 이유는 이번에도 오픈소스로 모델을 제공하였다는 것인데요.
이는 OpenAI, Google, Anthropic 등 미국 빅테크 기업들이 막대한 자원을 투입해 개발한 프리미엄 모델들에 대한 일종의 청야전술로 볼 수 있을 것 같습니다.
물론 기술과 노하우는 여전히 남아있겠지만, 누구나 고성능 AI 모델을 서빙할 수 있고 진입장벽이 점점 낮아지게 되면, 기존 유료 AI 서비스 제공업체들의 단기적 수익 구조에 문제가 생길 수도 있을것으로 보입니다.
허깅페이스
https://huggingface.co/deepseek-ai/DeepSeek-R1-0528
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 5월 30일 오전 12:11
나는 종종 생산성을 올리기 위한 각종 개발 툴은 물론, 라이브러리나 소스 코드를 구매하기도 한다.
소스 코드의 경우 실제로 써먹지 못하는 경우도 상당수 되긴 하지만, 그래도 구성이나 코드를 보면서 배우는게 있기 때문에 학습 비용이라고 생각하고 가끔 구매하는 편이다.
앞으로의 코테는 설명을 주고 코드를 짜라고 하는 것이 아니라, 코드를 주고 설명을 하라는 것이 유효할 것이다.
내 경우는 이미 그렇게 하고 있는데, 요구사항을 주고 개발을 요청. 결과물이 요구사항대로 개발이 잘 되었다면, 다음 단계로 제출한 코드를 리뷰하며 설명을 요청한다.