๐ LLM์ "๋ชจ๋ฅธ๋ค๊ณ ๋งํ ์ฉ๊ธฐ"
LLM์ ์ฌ์ฉํ๋ค๋ณด๋ฉด ๋ชจ๋ธ์ด ์ ๋ง ์ง์์ด ์์ด์ ๋๋ตํ๋ ๊ฒ์ธ์ง, ๋ฌธ์ฅ์ ์ธ์์ ์ถ๋ ฅํ๋ ๊ฒ์ธ์ง ๊ถ๊ธํ ๋๊ฐ ๋ง์ต๋๋ค(์๊ฐํด๋ณด๋ ์ฌ๋๋ ๋ง์ฐฌ๊ฐ์ง๋ค์). ํนํ ํ๋ฆฐ ์ ๋ณด๋ฅผ ํ์คํ ๋ฏ ๋๋ตํ๋ฉด ์์ฌ์ด ์ปค์ง๊ฒ ๋๋ ๊ฒฝํ์ ๋ค๋ค ํ๋ฒ์ฏค์ ํด๋ณด์ จ์ํ ๋ฐ์, ๐ค ๊ทธ๋ ๋ค๋ฉด, ๋ชจ๋ธ์ด ํ์คํ ์๋ ์ ๋ณด์ ๋ชจ๋ฅด๊ฑฐ๋ ๋ถํ์คํ ์ ๋ณด๋ฅผ ๊ตฌ๋ถํ ์ ์๋ค๋ฉด ์ด๋จ๊น์? ๐๐ปโโ๏ธ R-Tuning ๋ฐฉ๋ฒ๋ก ์ ์ฌ์ ํ์ต๋ชจ๋ธ์ด ์๋ ์ ๋ณด์ ๋ชจ๋ฅด๋ ์ ๋ณด๋ฅผ ๊ตฌ๋ถํ๊ณ ํ๋กฌํํธ๋ฅผ ๋ค๋ฅด๊ฒ ํ์ตํ๋ฉด, ๊ธฐ์กด Instruction Tuning๋ณด๋ค ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค๊ณ ํฉ๋๋ค. ์ด๋ฒ NAACL 2024์์ Outstanding Paper Awards๋ฅผ ์์ํ ๋ณธ ๋ ผ๋ฌธ์ ์ ์๋ ๊ธฐ์กด Instruction Tuning์ด ๋ชจ๋ธ์ด ์ด๋ค ์ง์์ ์๊ณ ์๋์ง ์ฌ๋ถ์ ์๊ด์์ด "๋ฌธ์ฅ ์์ฑ"์ ์ด์ ์ ๋ง์ถ๊ธฐ ๋๋ฌธ์ ํ๊ฐ ํ์(Hallucination)์ด ๋ฐ์ํ๋ค๊ณ ๋ณด๋๋ฐ์, ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด 1) ๋จผ์ QA๋ฐ์ดํฐ์ ์์ ๋ชจ๋ธ์๊ฒ ์ง๋ฌธ์ ํ๊ณ ๋ต๋ณ์ด ์ ๋ต๊ณผ ์ผ์นํ๋ฉด ํด๋น ์ง๋ฌธ์ ์ฌ์ ํ์ต๋ชจ๋ธ(Pretrained Language Model; PLM)์ด "์๋ ์ง์"์ผ๋ก, ์ผ์นํ์ง ์์ผ๋ฉด "๋ชจ๋ฅด๋ ์ง์"์ผ๋ก ๊ตฌ๋ถํ๊ณ 2) ์๋ ์ง์" ๊ณผ "๋ชจ๋ฅด๋ ์ง์"์ ๋ณ๊ฐ์ ํ๋กฌํํธ ํํ๋ก ๋ง๋ค์ด์ Instruction Tuning์ ์งํํ๋๋ 3) "์๋ ์ง์"์ ๋ํด์ ๊ธฐ์กด Instruction Tuning ๋ณด๋ค ๋ ์ฑ๋ฅ์ด ์ข์์ก๋ค๊ณ ์คํ ๊ฒฐ๊ณผ๋ฅผ ํตํด ๋ณด์ฌ์ฃผ๊ณ ์์ต๋๋ค. ๐ R-Tuning: Instructing Large Language Models to Say โI Donโt Knowโ NAACL 2024 https://aclanthology.org/2024.naacl-long.394/