๐ค LLM ๋ถ์ผ์ ๋ ์ค๋ฅด๋ ํ๋: Abstention (๊ธฐ๊ถ)
์ต๊ทผ LLM์ ํ๊ฐํ์(Hallucination)์ ์ค์ด๊ธฐ ์ํ ๋์์ผ๋ก ์ต๊ทผ ๋ ์ค๋ฅด๋ ๋ฐฉ๋ฒ๋ก ์ค ํ๋๋ "Abstention"์ ๋๋ค. ๋จ์ด์ ๋ป์ "๊ธฐ๊ถ, ์์ "์ธ๋ฐ์, ์ฐ๋ฆฌ ๋ง๋ก๋ "๋ต๋ณ ํฌ๊ธฐ"์ ๋๊ฐ ๋ ๊ฒ ๊ฐ์ต๋๋ค. ์ฆ, LLM์ด ์ค์ค๋ก๊ฐ ๋ถํ์คํ ์ ๋ณด์ ๋ํด์๋ ๋ต๋ณ์ ๊ฑฐ๋ถํ ์ ์๋๋ก ํ๋ ๋ฐฉ๋ฒ์ ๋ํ ์ฐ๊ตฌ์ธ๋ฐ์, ์์ฆ ๊ด๋ จ ์ฐ๊ตฌ๊ฐ ๋ง์ด ๋์ค๋ ๊ฒ ๊ฐ์ต๋๋ค. ๊ด์ฌ ์์ผ์ ๋ถ๋ค์ ์์ํ๊ธฐ ์ข์ ๋ ผ๋ฌธ 3ํธ์ ์๋์ ์๊ฐํด๋์์ผ๋ ๊ฐ๋จํ๊ฒ ์ดํด๋ณด์ ๋ ์ข์ ๊ฒ ๊ฐ์ต๋๋ค. The Art of Refusal: A Survey of Abstention in Large Language Models * LLM์ ๋ต๋ณ ํฌ๊ธฐ(Abstention) ๋ฐฉ๋ฒ์ ๋ํ Survey Paper * ์๋ ์ธ๊ฐ์ง ๊ด์ ์ ๊ธฐ์ค์ผ๋ก ๊ธฐ์กด ์ฐ๊ตฌ๋ฅผ ๋ถ์ํฉ๋๋ค. * (1) The Query: ์ง๋ฌธ ์์ฒด์ ๋ชจํธ์ฑ์ผ๋ก ๋ต๋ณ ํํผ๊ฐ ํ์ํ ๊ฒฝ์ฐ * (2) The Model: ๋ชจ๋ธ ์ง์์ ๋ถ์กฑ์ผ๋ก ๋ต๋ณ ํํผ๊ฐ ํ์ํ ๊ฒฝ์ฐ * (3) Human Values: ์ค๋ฆฌ์ /์ฌํ์ ๊ฐ์น ๋ฑ์ ์ด์ ๋ก ๋ต๋ณ ํํผ๊ฐ ํ์ํ ๊ฒฝ์ฐ * https://arxiv.org/pdf/2407.18418 The Art of Saying No: Contextual Noncompliance in Language Models * ๋ต๋ณํ์ง ์์๋ ๋๋(Noncompliance) ์ง๋ฌธ ์ ํ์ ์ธ๋ถํํ๊ณ ๊ด๋ จ ๋ฐ์ดํฐ์ ์ ์ ๊ณต * "(1) The Query" ์ ํ์ ํด๋นํ๋ ๋ฐฉ๋ฒ๋ก ๊ณผ ๋ฐ์ดํฐ๋ฅผ ์๊ฐํฉ๋๋ค. * AllenAI, University of Washington, Microsoft Research ๋ฑ ๊ตต์งํ ๊ธฐ๊ด๋ค์ด ์ฐธ์ฌํ ๋ ผ๋ฌธ์ด๋ค์. * https://www.arxiv.org/pdf/2407.12043 R-Tuning: Instructing Large Language Models to Say โI Donโt Knowโ * Instruction Tuning ๋จ๊ณ์์ ๋ชจ๋ธ์ด Parametric Knowledge ๋ฅผ ๋ฒ์ด๋๋ ์ง๋ฌธ์ ๋ํด์๋ ๋ต๋ณํ์ง ์๋๋ก ํ๊ธฐ ์ํด 1) ๋ฌด์์ ๋ชจ๋ฅด๋ ์ง๋ฅผ ํ์ ํ๊ณ 2) ๋ชจ๋ฅด๋ ๊ฒ์ ๋ํด์๋ ๋ต๋ณํ์ง ์๋๋ก ํ์ตํ๋ ๋ฐฉ๋ฒ ์ ์ * "(2) The Model" ์ ํ์ ํด๋นํ๋ ๋ฐฉ๋ฒ๋ก ์ ์ ์ํฉ๋๋ค. * ์ต๊ทผ NAACL 2024์์ Outstanding Paper awards๋ฅผ ์์ํ์ด์. * https://aclanthology.org/2024.naacl-long.394/