한국어 언어 모델의 성능은 대학 수학 능력 시험으로 평가해야하지 않을까요? 마침 GPT-4로 수능 시험을 푼 프로젝트도 있으니, 이걸 기반으로 각 언어 모델마다 테스트를 해 보면 재밌기도 하고,
한국어 언어 모델의 성능은 대학 수학 능력 시험으로 평가해야하지 않을까요? 마침 GPT-4로 수능 시험을 푼 프로젝트도 있으니, 이걸 기반으로 각 언어 모델마다 테스트를 해 보면 재밌기도 하고, 한국어 능력에 대한 좋은 연구가 될 듯. https://github.com/NomaDamas/KICE_slayer_AI_Korean