๐ MiniCPM, 2B๋ก 70B๋ฅผ ๋ฐ์ด๋์ LLM
์ต๊ทผ ์ํ LLM๋ชจ๋ธ์ ์ฝ์ง์ด ๊ณ์๋๋ฉด์, Phi 2, Gemma, Octopus v2 ๋ฑ 20~30์ต๊ฐ ์์ค์ ํ๋ผ๋ฏธํฐ๋ง ๊ฐ์ง๊ณ ๋ ๊ณ ์ฑ๋ฅ์ ๋ด๋ ๋ชจ๋ธ๋ค์ด ์์ ๋์ค๊ณ ์๋๋ฐ์. ์ ๋ฉฐ์น Mixture-of-Depths๋ผ๋ ๊ธฐ๋ฒ์ผ๋ก Octopus v2๊ฐ ์์ฃผ ํซํ ๊ฐ์ด๋ฐ, ๋ ๋ค๋ฅธ ์ฌ๋ฏธ๋ ๋ชจ๋ธ์ด ๋์๋ค์. MiniCPM์ MMLU, HumanEval, GSM8K ๋ฑ ๋ํ์ ์ธ ๋ฒค์น๋งํฌ์ ์ข ํฉ์ ์ธ ์ฑ๋ฅ์์ Mistral-7B, Llama2-13B, MPT-30B, Falcon-40B, Vicuna -33B ๋ฑ์ ๋ชจ์กฐ๋ฆฌ ๋ฐ์ด๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค. ์ฌ์ง์ด MT-bench์์๋ 20์ต๊ฐ์ ํ๋ผ๋ฏธํฐ๋ง์ผ๋ก 700์ต๊ฐ๋ฅผ ๊ฐ์ง LLaMA-2-70B-chat์ ํฌ๊ฒ ๋ฐ์ด๋๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค. ์ด ์ฐ๊ตฌ๋ ์ฑ๋ฅ์ด ๋ฐ์ด๋๋ค๋ ๊ฒ ๋ณด๋ค๋ ๋ค๋ฅธ ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ ์๋๋ฐ์. ์ด๋ ๋ฎค-ํธ๋์คํผ(uTransfer)๋ผ๋ ๋ฐฉ๋ฒ์ผ๋ก ๋ฐฐ์น ์ฌ์ด์ฆ, ํ์ต๋ฅ ๋ฑ์ ํ์ดํผํ๋ผ๋ฏธํฐ(๋ชจ๋ธ ํ๋ จ์ ์ฌ์ฉํ๋ ์ต์ )๋ฅผ ๋งค์ฐ ์์ ๋ชจ๋ธ(0.009B)์์ ์คํํด์ ๊ฐ์ฅ ์ข์ ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ์์๋ธ ๋ค, ์ด๊ฑธ ๋ ํฐ ๋ชจ๋ธ(2B)์์ ๊ทธ๋๋ก ์ฌ์ฉํด๋ ๊ทธ ํจ๊ณผ๊ฐ ์๋ค๋ ๊ฒ์ ์ฆ๋ช ํ๋ค๋ ๊ฒ ์ ๋๋ค. ์ฆ, ์์ ๋ชจ๋ธ๋ก ํจ์จ์ ์ผ๋ก ํ์ดํผํ๋ผ๋ฏธํฐ๋ฅผ ํ์ ํ ์ ์์ผ๋ฏ๋ก ํฐ ๋ชจ๋ธ์ ๋งค์ฐ ํจ์จ์ ์ผ๋ก ํ์ต ์ํฌ ์ ์๊ฒ ๋๋ค๋ ๊ฒ ์ ๋๋ค. ๋ง์ฝ ์ด ๋ฐฉ๋ฒ์ด ์ ๋ง๋ก ์ผ๋ฐ์ ์ผ๋ก ์ฌ์ฉ๋ ์ ์๋ค๋ ๊ฒ์ด ๊ฒ์ฆ๋๋ฉด, ์๋ง์ LLM ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ์์ฝ๊ฒ ๋ปฅํ๊ธฐใ ใ ํ ์ ์๊ฒ ๋ผ์ ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ด ์ ๋ฐ์ ์ผ๋ก ํ ๋จ๊ณ ๋น ๋ฅด๊ฒ ์ค๋ฅผ ์๋ ์์ ๊ฒ ๊ฐ์ต๋๋ค.