๐ ๊ตญ๋ด ๊ธฐ์ , ์คํLLM ์ธ๊ณ 1์!!
'ํฌ๋์งํธ' ๋ผ๋ ๊ตญ๋ด ๊ธฐ์ ์์ ํ๊น ํ์ด์ค์ Open LLM Leaderboard 1์๋ฅผ ๋ฌ์ฑํ๋ ์์์ด ์์์ต๋๋ค. ํด๋น ๋ชจ๋ธ์ด ๊ตญ๋ด KO-LLM Leaderboard์์ 1์๋ฅผ ์ฐจ์งํ ๋ด์ค๊น์ง๋ง ํด๋, '๊ตญ๋ด ๋ฐ์ดํฐ์ ๋ํ ์ฑ๋ฅ ๊ฐ์ ' ์ฌ๋ก ์ ๋๋ก ์๊ฐํ์ต๋๋ค. ํ์ง๋ง ์ด๋ฒ ์์์ ํ๊ตญ์ด์ ๋ํ ์งํ๊ฐ ์๋ 'LLM ๋ชจ๋ธ ์์ฒด์ ์ฑ๋ฅ ์งํ๋ฅผ ํฌ๊ฒ ๊ฐ์ ํ๋ค'๋ ์ ์์ ๋์ฑ ์ ์๋ฏธํ ๊ฒ ๊ฐ์ต๋๋ค. ๋ชจ๋ธ์ ๋ํ ์์ธํ ์ค๋ช ์ ๋ด๊ฒจ์์ง ์์ง๋ง, ํต์ฌ ํค์๋๋ก SGD : A Study on Self-Generated Dataset creation method for DPO Learning ๋ผ๋ ๋ฐฉ๋ฒ์ ์ ์ํ๊ณ ์์ต๋๋ค. ๋ชจ๋ธ์ด ์์ฑํ ๋ฌธ์ฅ๊ณผ ์ ๋ต ๋ฌธ์ฅ(๊ธฐ์กด ๋ฐ์ดํฐ์ )์ ๋น๊ตํ์ฌ, ๊ธฐ์กด ๋ฐ์ดํฐ์ ์ ์๋ ๋ฌธ์ฅ์ ์ถ๊ฐํ๋ค๋ ์์ด๋์ด๋ฅผ ํ์ฉํ๋ค๊ณ ํฉ๋๋ค. ๋ฆฌ๋๋ณด๋์ ์งํ๋ฅผ ์ดํด๋ณด๋ฉด, ํด๋น ๋ชจ๋ธ์ HellaSwag๋ผ๋ ์งํ์์ ์๋ฑํ ์ฐจ์ด๋ฅผ ๋ง๋ค์ด 1์๋ฅผ ์ฐจ์งํ๊ณ ์์ต๋๋ค. HellaSwag * ๋ชฉ์ : ์์ ์ถ๋ก HellaSwag๋ ๋ฏธ์์ฑ๋ ๊ตฌ์ ์ LLM์ผ๋ก ํ์ฌ๊ธ ์์ฑํ๊ฒ ํฉ๋๋ค. ๋ฌธ๋งฅ์ ๋ฐ๋ผ ํ ์คํธ๋ฅผ ์ดํดํ๊ณ ์์ธกํ๋ ๋ฅ๋ ฅ์ ํ ์คํธํจ์ผ๋ก์จ LLM์ ์์ ์ถ๋ก ์ ํ๊ฐํฉ๋๋ค. * ์์: ๋ถ์์ ํ ๊ตฌ์ ์ด ์ฃผ์ด์ง๊ณ , ์ฃผ์ด์ง ๋ฌธ๋งฅ์์ ๋ ผ๋ฆฌ์ ์ผ๋ก ์ด์ด์ง๋ ๊ฒฐ๋ง์ LLM์ด ์์ฑํด์ผ ํฉ๋๋ค. ์๋ง GAN๊ณผ ๊ฐ์ด ๋ฐ์ดํฐ์ ์ ์ ์ ํ ์ฆ๊ฐ์ด ๋ชจ๋ธ์ ์์ ์ฑ์ ๋์ด๋๋ฐ ์ํฅ์ ์ฃผ์ง ์์๋ ์ถ์ต๋๋ค. ๊ธ์ต AI๋ฅผ ์ฐ๊ตฌํ๋ ์ ์ฒด์์ ๋์จ ๊ฒฐ๊ณผ๋ผ ๋ค์ ๋ฌ๊ธ์์ ์ ์์ต๋๋ค. ํ์ง๋ง LLM ๋ชจ๋ธ์ ๊ทผ๊ฐ์ด ๋๋ ์๊ณ์ด ์ฐ๊ตฌ๊ฐ ๊ธ์ต๊ณ์ ์ค๋ ์์ ์๋ ์ ์ ์๊ฐํ๋ฉด ์ดํด๊ฐ ๋๊ธฐ๋ ํฉ๋๋ค ใ ใ * ํ๊น ํ์ด์ค ๋ฆฌ๋๋ณด๋ https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard (๋ชจ๋ธ๋ช : davidkim205/Rhea-72b-v0.5) * ๋ด์ค ๊ธฐ์ฌ https://kr.aving.net/news/articleView.html?idxno=1789199