๐๏ธ ์ฑ์ฉ ๊ฐ๋ฅํ AI ์ํํธ์จ์ด ์์ง๋์ด ์ถ์
Cognition Lab์์ ์ต์ด์ ์ฑ์ฉ ๊ฐ๋ฅํ AI ์ํํธ์จ์ด ์์ง๋์ด Devin์ ์ถ์ํ์ต๋๋ค. Devin์ ์ฃผ์ AI ํ์ฌ์ ์ค๋ฌด ์์ง๋์ด๋ง ์ธํฐ๋ทฐ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ํต๊ณผํ์ผ๋ฉฐ, Upwork์์ ์ค์ ์์ ๋ ์๋ฃํ๋ค๊ณ ํฉ๋๋ค. Devin์ ์์ฒด ์ ธ, ์ฝ๋ ํธ์ง๊ธฐ ๋ฐ ์น ๋ธ๋ผ์ฐ์ ๋ฅผ ์ฌ์ฉํ์ฌ ์์ง๋์ด๋ง ์์ ์ ํด๊ฒฐํ๋ ์์จ ์์ด์ ํธ์ธ๋ฐ์. ์ด๋ฐ ํตํฉ์ ์ธ ๋ฅ๋ ฅ์ ํตํด ์์ ํ์คํฌ ์์ค ๋ฟ ์๋๋ผ ์ ํ๋ฆฌ์ผ์ด์ ๋ ๋ฒจ์ ์ํํธ์จ์ด๋ฅผ ๊ฐ๋ฐ ํ ์ ์๋ค๊ณ ํฉ๋๋ค. ์ค์ค๋ก ์์ฒด AI ๋ชจ๋ธ์ ํ์ธํ๋ํ์ฌ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ๋ ํฉ๋๋ค. GitHub์์ ์ค์ ์คํ ์์ค ํ๋ก์ ํธ์ ์ด์์ ํด๊ฒฐํ๋๋ก ์์ฒญํ๋ SWE-Bench ๋ฒค์น๋งํฌ์์, Devin 13.86%๋ฅผ ์ ๋๋ก ํด๊ฒฐํ๋ค๊ณ ํฉ๋๋ค. ์ด์ ์ ์ต์ ์ฑ๋ฅ์ 1.96% ๋ก ๋งค์ฐ ๋ฐ์ด๋ ์์ค์ ๋๋ค. Cognition Lab์ ์ฐ๋ฝํ๋ฉด Devin์ ์ผ๋ฆฌ ์ต์ธ์ค๋ก ์ฑ์ฉ ํ ์ ์๋ค๊ณ ํ๋ค์. ์ต์ LLM ๊ธฐ์ ๋ํฅ์์ ๋งค์ฐ ๊ธด ์ปจํ ์คํธ๋ฅผ ๋งค์ฐ ์ ํํ๊ฒ ์ดํดํ๋ ๋ฅ๋ ฅ์ด ๊ฑฐ์ ์๋ฒฝํด์ง๋ฉด์, ์ ๋งํ ๊ท๋ชจ์ ์ ํ๋ฆฌ์ผ์ด์ ์ ์์ค๋ ํต์งธ๋ก ์ดํดํ๊ณ ๋ค๋ฃฐ ์ ์๊ฒ ๋์๋๋ฐ์. ๊ทธ๋ ๋ค๋ฉด ์์ผ๋ก ์ํํธ์จ์ด๋ผ๋ ๊ฒ์ด ๋ง๋ค์ด ๋ ๊ฒ์ ์ฐ๋ ๊ฒ์ด ์๋๋ผ, ์ฌ์ฉ์์ ์์ฒญ์ ๋ฐ๋ผ ๊ทธ ์ฆ์ on-demand๋ก ๋ง๋ค์ด์ง๊ณ ์ฌ์ฉ๋๋ ์๋๊ฐ ์ค์ง ์์๊น ์ถ์ต๋๋ค. ๋ง์ผ ๊ทธ๋ ๊ฒ ๋๋ค๋ฉด, ์ํํธ์จ์ด์ ๊ธฐ๋ฐ์ ๋ง๋๋ low-level ์์ง๋์ด๋ค์๊ฒ ์์ฃผ ํฐ ์ํฅ์ ์๊ฒ ์ง๋ง, ์์ฉ ์ํํธ์จ์ด ๊ฐ๋ฐ์๋ค์ ์ผ์ ์์ฃผ ํฌ๊ฒ ๋ฐ๋๊ฒ ๋ ๊ฐ๋ฅ์ฑ์ด ๋์ ๊ฒ ๊ฐ์ต๋๋ค. https://www.cognition-labs.com/blog