DeepSeek 모델을 재현할 수 있을까?

DeepSeek가 추론 AI 모델 'R1'을 공개한 지 일주일도 안 되어, Hugging Face의 연구진들이 "개방된 지식"을 추구하는 차원에서 이 모델을 처음부터 재현하려는 프로젝트를 시작했습니다. 'Open-R1'이라 명명된 이 프로젝트는 Hugging Face의 연구 책임자 Leandro von Werra와 엔지니어들이 주도하고 있으며, R1 모델의 학습 데이터를 포함한 모든 구성 요소를 오픈소스화하는 것을 목표로 합니다. 이러한 시도의 배경에는 DeepSeek의 "블랙박스" 같은 공개 방식에 대한 문제의식이 있습니다. R1은 기술적으로는 "공개"되어 있지만, 모델을 구축하는 데 사용된 도구들의 상당 부분이 비공개로 남아있어 진정한 의미의 "오픈소스"라고 보기는 어렵습니다. R1은 물리학, 과학, 수학 분야에서 특히 뛰어난 성능을 보이는 추론 모델로, OpenAI의 o1 추론 모델과 비슷하거나 더 나은 성능을 보여주고 있습니다. DeepSeek의 챗봇 앱이 애플 앱스토어 차트 상위권에 오르면서 큰 주목을 받았습니다. Hugging Face 팀은 768개의 Nvidia H100 GPU를 갖춘 Science Cluster를 활용해 몇 주 안에 R1을 재현하는 것을 목표로 하고 있으며, GitHub에서 이미 10,000개의 별을 받으며 커뮤니티의 큰 관심을 끌고 있습니다. 이 프로젝트를 통해 AI 연구자들이 더 나은 오픈소스 추론 모델을 개발할 수 있는 기반을 마련할 수 있을 것으로 기대됩니다. 일부에서 오픈소스 AI의 악용 가능성에 대한 우려를 제기하고 있지만, Hugging Face 팀은 이러한 개방성이 AI 발전에 더 큰 이점을 가져다줄 것이라고 믿고 있습니다. 자세한 내용은 아래 기사를 참고해주세요! https://techcrunch.com/2025/01/28/hugging-face-researchers-are-trying-to-build-a-more-open-version-of-deepseeks-ai-reasoning-model/?utm_source=substack&utm_medium=email

DeepSeek 모델을 재현할 수 있을까?

알림