OpenAI 의 진짜 오픈모델 발표 : gpt-oss-120b

벤치마크 상으론 가성비 라인을 타겟하고 있는데요
Gemini Flash 2.5 정도의 성능에 꽤 낮은 비용을 보여줍니다. (그림 참조)


주목할 부분은 굉장히 빠른 생성속도인데요.
Openrouter 기준으로 대부분의 모델들이 50~60 의 tps 를 보이는데 비해 기본적으로 200tps 를 보여줍니다.


20tps 가 쓰기 불편한 정도, 60tps 는 많이 쓰는 Claude Sonnet 의 속도인데요. 200tps 는 상당히 양자화된 모델에서만 볼 수 있는 속도였는데, 이를 기본 모델로 보이고 있다는 것이 인상적입니다.


다만, 많은 주목을 받는 OpenAI의 모델인 만큼 빠르게 실사용 후기가 올라오고 있는데요. 벤치마크 만큼 훌륭하지 않다는 사용기가 많아 천천히 지켜보는게 좋겠습니다.

허깅페이스
https://huggingface.co/openai/gpt-oss-120b
https://huggingface.co/openai/gpt-oss-20b

벤치마크 링크
https://artificialanalysis.ai/

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 8월 6일 오전 1:21

댓글 0