Llama-3보다 뛰어난 오픈소스 모델, Qwen2 등장!
Qwen Team에서 오늘 Qwen2 모델을 릴리즈하였습니다. 아파치 2.0 라이센스라서 자유롭게 모델을 활용해볼 수 있겠는데요. Demo도 Hugging Face에 있어서 한번 써보았는데 한국어도 꽤 잘합니다. MMLU, GPQA 등 여러 유명한 벤치마크에서 기존 오픈소스 sota 모델인 Llama3, Mixtral 8x22B를 가볍게 뛰어넘었네요. 게다가 한국어를 포함한 28개 언어로 학습이 되었습니다. 전 개인적으로 gpt-4o 출시되었을 때, 오픈소스 모델 활용에 대한 맘을 잠깐 접었었는데.. 아직 희망의 끈을 놓지 않으신 분들은 Llama-3보다 더 잘 활용해볼 수 있겠습니다! 기회가 된다면, 오픈소스 모델들도 한국어 벤치마크로 평가해보고 싶네요.. 공식 블로그 링크 👉 https://qwenlm.github.io/blog/qwen2/