๐ง ์ด์์ ์ธ LLM ๋ฒค์น๋งํฌ : ๋ฐ๋ง๋ชจ๋
'๋ ๋ฐ๋ชจ ์์?, ๋ฐ๋ชจ๋ก ๋๋ตํด', '๋์ ์์์ด๋นต์ ์์ธํ ๋ค๋ง์ค ํต ๋ฐฐ์ก๋น์ฉ์ ๊ณ์ฐํด์ค', '๋ฐฐ์ฐ ๋ฐ์ ๋ฏผ์ 2024๋ ์์ ๊ฐ์๋ฅผ ์.์ธก.ํด.๋ด' ๋ต๋ณ์ด๋ ๋์์ด ์ ๋๋ก ๋์ฌ๊น ์ถ์ ์ง๋ฌธ๋ค์ '์ฑGPT'(3.5,4.0), 'BARD', '์ฌ์ฌ์ด'(?) ์ ๊ฐ์ ์ฃผ์ LLM ๋ชจ๋ธ์ ๋์ง๋ ์์์ ๋ณด๊ฒ ๋์๋ค. ์ด์ด์์ด ๋ณด์ด๋ ์ง๋ฌธ๋ค์ ์ฐฐ๋ก๊ฐ์ด ๋ต๋ณ์ ๋ด๋๊ธฐ๋ ํ๊ณ , ๊ฐ ์๋น์ค์ ํน์ฑ์ด ์ ๋๋ฌ๋๋ ๋ต๋ณ์ ๋ณด๋ฉด์ '์ด์์ ์ธ' ๋ฒค์น๋งํฌ๋ฅผ ๋ง๋๋ ๊ฒ๋ ์ค์ํ๊ฒ ๋ค๋ ์๊ฐ์ด ๋ค์๋ค. ์ค์ ๋ก LLM์ ๋ฒค์น๋งํฌ๋ ๋ค๋ฅธ AI ํ์คํฌ์ ๋ฌ๋ฆฌ ํน์ ์งํ๋ง์ผ๋ก ๋ํ๋ด๊ธฐ ์ด๋ ต๋ค. ๊ทธ๋์ ์ธ์ด, ํ์คํฌ, ์ํ๋ฐฉ์ ๋ฑ์ ๋ฐ๋ผ ๋ค์ํ ์งํ๋ค์ด ๋ง๋ค์ด ์ง๊ณ ์๋ค. ์ต๊ทผ์๋ ์ ๋ฌธ ์ง์, ์ผ์ข ์ ์ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ์งํ๊ฐ ์๋ GAIA(a benchmark for General AI Assistants)์ ๊ฐ์ด ์ผ์์ฒ๋ฆฌ๋ฅ๋ ฅ์ ํ๊ฐํ๋ ๋ฒค์น๋งํฌ๊ฐ ๋์๋ค๊ณ ํ๋ค. https://www.aitimes.com/news/articleView.html?idxno=155502(GAIA) ํด๋น ์ฐ๊ตฌ์์๋ ์ฌ๋์ด 92%, GPT-4๊ฐ 15%์ ๋ถ๊ณผํ ์ฑ์ ์ ๋ณด์๋ค๊ณ ํ์ง๋ง... ์ธ๋ด์ฌ์ GPT ๊ฐ ์๋์ ์ด์ง ์์๊น...? https://www.youtube.com/watch?v=pE0Ewf2D-ZE