๐ฐ OpenAI์ Superalignment ํ ํด์ฒด
AI์ ์ ๋ ฌ(์ธ๋ฅ์๊ฒ ์ ์ตํ ๋ฐฉํฅ์ผ๋ก ํ์ต์ํค๋ ๊ฒ) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํ์ธ Superalignmentํ์ Lead์๋ Ilya์ ํจ๊ป co-lead์๋ Jan Leike๊ฐ ์ฌ์ํ๋ฉด์, ์ค์ง์ ์ผ๋ก ํ์ด (์์ง)ํด์ฒด ๋ ๊ฒ ๊ฐ์ต๋๋ค. OpenAI๊ฐ Alignment๋ณด๋ค ์ ํํ์ชฝ์ ๋ ๋น ๋ฅด๊ฒ ๊ฐ์ ธ๊ฐ๋ ์ชฝ์ผ๋ก ์ฐ์ ์์๋ฅผ ๋์ด๋ฉด์ ๋ฐ์ํ ๊ตฌ์กฐ์ ์ธ ๋ณํ์ธ ๊ฒ ๊ฐ์ต๋๋ค. Alignment์ ๋ํ ์ฐ๋ ค๊ฐ ์๊ธด ํ์ง๋ง, ์ด๋ก์ธํด OpenAI์ ํ๋ณด๋ ๋์ฑ ๋นจ๋ผ์ง ๊ฒ์ผ๋ก ์์๋ฉ๋๋ค. ๊ทธ๋ณด๋ค, ์ด๋ฌํ ๋ณํ์์ ์๊ฐํด ๋ณผ ์ ์๋ ๊ฐ์ค์ด ๋ค์๊ณผ ๊ฐ์ด ์๋๋ฐ์. 1๏ธโฃ OpenAI๋ ํจ์ฌ ๋ ๋์ ๋ชจ๋ธ์ด ์ด๋ฏธ ๊ฐ์ง๊ณ ์์. ๊ทธ๋ ์ง ์๋ค๋ฉด ChatGPT๋ก ์ด๋ฏธ ๋ง์ ๋์ ๋ฒ๊ณ ์๋ ์ํ์์ GPT-4 ์์ค์ ๋ชจ๋ธ์ ๋ชจ๋ ์ฌ๋์๊ฒ ๋ฌด๋ฃ๋ก ์ ๊ณตํ์ง ์์ ๊ฒ. 2๏ธโฃ ํด์ฌํ๋ ํ์(Ilya, Jan๋ฑ)์ด ๊ณง ๋ ํฐ ๋ฅ๋ ฅ์ด ๋์ฌ ๊ฒ์ ๊ฑฑ์ ํ์ง ์๋๋ค๋ฉด ์ ๋ ฌ์๋ ์ ๊ฒฝ ์ฐ์ง ์์ ๊ฒ. AI๊ฐ ์ง๊ธ ์์ค์ ๋จธ๋ฌธ๋ค๋ฉด ๋๋ถ๋ถ ๋ฌธ์ ๊ฐ ๋์ง ์์ ๊ฒ์ด๊ธฐ ๋๋ฌธ. Jan Leike๊ฐ ์ฌ์ํ๋ฉด์ ์ด ๊ธ์๋ OpenAI๊ฐ Alignment(์ ๋ ฌ)์ ์ํํด์ ๋ ์ด์ ํจ๊ป ํ ์ ์๋ค๊ณ ํ๋จํด์ ์ฌ์ํ๋ค๊ณ ํ๋๋ฐ์. ์ด๋ฐ ์ํฉ๋ค์ ๋ณด๋ฉด ์๋ง๋ Ilya์ ํจ๊ป Superalignment์ ๊ด๋ จ๋ ํ์ฌ๋ ๋จ์ฒด๋ฅผ ์ค๋ฆฝํ์ง ์์๊น๋ผ๋ ์ถ์ธก์ด ๋ฉ๋๋ค. OpenAI์ ์ด๋ฆ๊ณผ ๋ฌ๋ฆฌ ๋ด๋ถ์ ํ๋ณด๊ฐ Apple๋งํผ์ด๋ ๋น๋ฐ๋ฆฌ์ ์งํ๋๊ณ ์๋๋ฐ์. ใ ใ ๊ณผ์ฐ ์ง์ค์ ์ด๋๊น์ง์ผ์ง ์ฌ๋ญ ๊ถ๊ธํด์ง๋๋ค.