간밤에 OpenAI가 오픈소스 모델을 발표했네요.
Anthropic이 Opus 4.1을 구글이 Genie 3를 공개했는데 이번에도 역시? 초를 치는 모습입니다. ㅋㅋ
일단 성능은 o3나 o3-mini와 준하는 수준이거나 더 좋은, 오픈소스 중 최고 수준입니다.
특히 인상적인건 이정도 성능을 컨슈머 레벨의 기기애서도 돌릴 수 있을 정도로 최적화되어있다는건데요.
120B은 80G 메모리, 20B 모델은 16G 메모리의 GPU에서도 돌아갑니다.
MoE로 구성되어 있는데, 액티브 파라미터가 120B은 5.13B, 20B 모델은 3.61B 밖에 안되고 네이티브로 퀀타이즈되어있어서 추론 속도도 매우 빠를 것으로 예상합니다.
또한 HuggingFace는 물론 vLLM, Metal이나 Ollama까지 준비되어있어서 쉽게 바로 사용 할 수 있습니다.
무엇보다 중요한건 라이센스인데요. Apache 2.0으로 완전히 자유롭게 사용할 수 있습니다. Llama도 라이센스의 변경 압박이 있을 것 같습니다.
오픈소스도 또 한 번 불타오르겠네요. 더불어 오픈소스 성능을 이정도로 제공한다면 GPT-5 모델들은 얼마나 성능이 좋을지? GPT-5 출시도 기대해봅니다. 😎🍿🥤
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 8월 6일 오전 1:16