[AI] xAI์ ๊ทธ๋ก(Grok)3
๐ ์๋ฏธ * chocolate (Early Grok-3): ๊ณต๊ฐ์ด์ ์ ์ฑ๋ด์๋ ๋์์ ์ฌ์ฉํ ์ด๋ฆ * xAI์ ๊ฐ๋ฐ์ค์ธ ์ฐจ์ธ๋ ์ธํ ๋ฆฌ์ ์ค AI ํ๋ซํผ * xAI์ ๋ชฉ์ : ์ฐ์ฃผ์ ๋ณธ์ง์ ์ดํดํ๊ณ ์ ํ๋ AI(์ง๋ฆฌ ์ถ๊ตฌ) * xAI ๊ธฐ์ ๊ฐ์น: ์ฃผ๋น 95๋ฌ๋ฌ, ์ฝ 1์กฐ 1์ฒ์ต ๊ธฐ์ ๊ฐ์น * ์ต๊ทผ 14์กฐ ๊ท๋ชจ์ ํฌ์ ์ ์น ํ์ ์ค * ๊ทธ๋ก(Grok) = Heinlein์ ๊ณต์๊ณผํ์์ค '๋ฏ์ ๋ ์ ์ด๋ฐฉ์ธ(Stranger in a Strange Land)'์์ ์ ๋๋ "์์ ํ (๊น์ด)์ดํดํ๋ค"๋ ์๋ฏธ * ๊ทธ๋ก(Grok)3: ์ดํด๋ ฅ, ๋ฌธ์ ํด๊ฒฐ๋ ฅ, ๋ฌธ๋งฅ ์ธ์์ ํฅ์์ํค๊ธฐ ์ํด ์ค๊ณ๋ Grok ์๋ฆฌ์ฆ์ 3์ธ๋ AI ๋ชจ๋ธ * ๋ชจ๋ธ: ๋ฒ ํ ์ถ๋ก ๋ชจ๋ธ์ธ Grok 3(Think)์ Grok 3 mini(Think) ๋ฐํ ๐ ์ฃผ์ ํ์ต * ํธ๋์คํฌ๋จธ ๊ธฐ๋ฐ ์ ๊ฒฝ๋ง(์ฐ์ ์ฌ๊ณ ํ๋ก์ธ์ค(CoT))๊ณผ ๊ณ ๊ธ ๊ฐํ ํ์ต * ์ปจํ ์คํธ ์ฟผ๋ฆฌ > ์ ๊ทผ ๋ฐฉ์ ๋์ ์กฐ์ > ํผ๋๋ฐฑ ๊ธฐ๋ฐ ์ถ๋ก ๊ฐ์ ๐ ์ฃผ์ ๊ธฐ์ ์ฌ์ * ์ด ๋งค๊ฐ๋ณ์: 2.7์กฐ * ํธ๋ ์ด๋ ๋ฐ์ดํฐ ์ธํธ: 12.8์กฐ ๊ฐ์ ํ ํฐ * ์๋ต ์ง์ฐ ์๊ฐ: 67๋ฐ๋ฆฌ์ด(ํ๊ท ) - ๊ณ ๊ธ ์ ๊ฒฝ๋ง ์ํคํ ์ฒ์ ๋ณ๋ ฌ ์ฒ๋ฆฌ๋ฅผ ํตํด ์ต์ ํ * ์ปจํ ์คํธ ์ฐฝ: 128,000๊ฐ ํ ํฐ - ๊ธด ํ์์ ๋ํ๋ฅผ ์ง์ํ๊ณ ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ ์์ ์ ์ฒ๋ฆฌํ๋ ๋ฅ๋ ฅ ํฌ๊ฒ ํฅ์ * ์ ๋ ฅ ํ ํฐ: ํด๋ก๋์ 5๋ฐฐ ๐ ์ฃผ์ ๊ธฐ๋ฅ * ์์ด์ ํธ: xAI๋ ๊ทธ๋กํฌ 3๋ฅผ ๊ตฌ๊ธ์ ์ ๋ฏธ๋ 2.0๊ณผ ์ ์ฌํ AI ์์ด์ ํธ๋ก ์ฝ๋์ธํฐํ๋ฆฌํฐ์ ์ธํฐ๋ท ์ก์ธ์ค ๊ธฐ๋ฅ * ๋ฉํฐ๋ชจ๋ฌ ๊ธฐ๋ฅ: ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค ๋ฐ ์ ์ฌ์ ์ผ๋ก ๋น๋์ค๋ฅผ ์ฒ๋ฆฌํ์ฌ ๋ค์ํ ๊ธฐ๋ฅ ์ ๊ณต * ํจ์จ์ฑ: ๊ฒฝ์์ฌ๋ณด๋ค 20% ๋ ํจ์จ์ * ๋น ๋ธ๋ ์ธ ๊ธฐ๋ฅ: Grok 3๋ ๋น ๋ธ๋ ์ธ์ ํ์ฉํ์ฌ CoT ๊ธฐ๋ฐ ์ถ๋ก ์ ๊ตฌ์ถํ์ฌ ๋์ฑ ์ฐฝ์์ ์ธ ๋ต๋ณ ์ ๊ณต * ๋ฅ์์น(DeepSearch) ๊ธฐ๋ฅ: OpenAI์ Perplexity์ ๊ฐ์ด ์ค์๊ฐ ์ง์ ํ์๊ธฐ๋ฅ์ธ ๋ฅ์์น ๊ธฐ๋ฅ ์ ๊ณต์ผ๋ก ๊ฒ์์๊ฐ ๊ธฐ์กด์ 1/3 * ํฅ์๋ ์ฑํ ๊ธฐ๋ฅ: ์ฌ์ธต ๊ฒ์๊ณผ ๊ณ ๊ธ ์ถ๋ก ๋ชจ๋ ๊ธฐ๋ฐ * ํฅ์๋ ์์ฑ ์ธ์: ๋จ์ํ ํ ์คํธ ๋ณํ์ ๋์ด, ํค, ์ต์, ์๋ ๋ฑ ๋ค์ํ ์์ ์ดํด * ๊ณ ๊ธ ์ถ๋ก (Advanced Reasoning), ์๊ฐ ์์ (Self-Correction)๊ณผ ๊ฐํ ํ์ต(Reinforcement Learning) ๐ ๋ฒค์น๋งํฌ * Grok 2์ ๋นํด ์งง์ ์๊ฐ ์์ 10๋ฐฐ ์ด์์ ๊ณ์ฐ ๋ฅ๋ ฅ * Grok3: * 2025๋ ๋ฏธ๊ตญ ์ํ๋ฅ๋ ฅ์ํ(AIME)์์ ์ต๊ณ ์์ค์ ํ ์คํธ ์๊ฐ ๊ณ์ฐ(cons@64)๊ณผ 93.3% ๋ฌ์ฑ * ๋ํ์ ์์ค์ ์ ๋ฌธ๊ฐ ์ถ๋ก (GPQA)์์ 84.6%, ์ฝ๋ ์์ฑ ๋ฐ ๋ฌธ์ ํด๊ฒฐ์ ์ํ LiveCodeBench์์ 79.4%๋ฅผ ๋ฌ์ฑ * MMLU(๋๊ท๋ชจ ๋ฉํฐํ์คํฌ ์ธ์ด ์ดํด): 92.7% * GSM8K(์ํ์ ์ถ๋ก ): 89.3% * ํด๋จผ์๋ฒ(์ฝ๋ฉ ์ฑ๋ฅ): 86.5% * ์์ ์ถ๋ก ํ ์คํธ: 90.1%(์ด์ฝ๋ ธ๋ฏน ํ์์ฆ, 2025) * Grok 3 mini * AIME 2024์์ 95.8% * LiveCodeBench์์ 80.4% ๊ธฐ๋ก * ์ฑ๋ด ์๋ ๋์์ 1402์ ์ Elo ์ ์๋ฅผ ํ๋ํ๋ฉฐ ๋ญํน 1๋ฑ ๊ธฐ๋ก * o1 ๋ฐ R1๊ณผ ๊ฐ์ ์ถ๋ก ๋ชจ๋ธ๋ณด๋ค ๋ ๋ฐ์ด๋ ์ฑ๋ฅ * ์ํ, ๊ณผํ, ์ฝ๋ฉ ๋ฒค์น๋งํฌ์์ Gemini 2.0 Pro, DeepSeek์ V3, OpenAI์ GPT-4์ ๊ฐ์ ๋ชจ๋ธ๋ณด๋ค ๋ฐ์ด๋ ์ฑ๋ฅ * ChatGPT o1 pro ๋ฐ DeepSeek R1์ ๋น๊ต: ์์ฐ์ด ์ดํด ๋ฐ ์๋ต ์์ฑ์ ์ ํ๋ 15% ํฅ์, 25% ๋ ๋น ๋ฅธ ์ฒ๋ฆฌ ์๋ ๐ ๊ฐ๋ฐ * ์ด๊ธฐ: 122์ผ ๋ง์ ์์ฒด ๋ฐ์ดํฐ์ผํฐ ๊ตฌ์ถ ๋ฐ 100,000๊ฐ์ GPU ๊ฐ๋ * ์ดํ: 92์ผ๋ง์ 200,000๊ฐ์ ๋๋ฐฐ์ GPU ์ฆ์ค * 100K H100 GPU๊ฐ ์๋ Memphis์ Colossus ์ํผํด๋ฌ์คํฐ์์ ํ์ตํ ๊ฒ์ผ๋ก ์์ * ์ด๊ณ ์ฑ๋ฅ ๋ฐ์ดํฐ์ผํฐ โ์ฝ๋ก์์ค(Colossus)โ: ์ธ๊ณ ์ต๋ AI ๋ฐ์ดํฐ์ผํฐ, ๋ฏธ๊ตญ ๋ฉคํผ์ค ์์น, NVIDIA H100 GPU 20๋ง๊ฐ ์ด์์ผ๋ก ๊ตฌ์ฑ ๐ ํฅํ ์ ๋ฐ์ดํธ * ์์ ์ฑ๊ณผ ์์ ํ ๊ธ๋ก๋ฒ ์ ๊ทผ์ฑ์ ์ํด ์์ง ํ๋ จ ์ค * xAI๋ Grok 3 ๊ธฐ๋ฐ ์์ฑ ์ฑ์ด OpenAI ๋ฐ Gemini์ ์ ์ฌํ ์ ํ๊ณผ ๊ฒฝ์ํ ์ ์๋๋ก ๊ณํ ์ค * ์คํ ์์ค ๋ชจ๋ธ: Grok 3 ์ ์ ์ถ์ ์ดํ Grok 2๊ฐ ์คํ ์์ค๋ก ์ถ์ ์์ * ์ํผ๊ทธ๋ก(Super Grok) ์ฑ: ๋ชจ๋ฐ์ผ ์ฌ์ฉ์๋ฅผ ์ํด Google Play ์คํ ์ด์์ ์ฌ์ ๋ฑ๋ก ๊ฐ๋ฅ * Grok 2๋ ์์ ์ฑ์ด ํ๋ณด๋๋ฉด ์คํ ์์ค ํํ๋ก ๋ฐฐํฌ ์์ ๐ ์ก์ธ์ค * ํ์ฌ๋ ๋ฒ ํ๋ฒ์ ์ผ๋ก X(twitter)์ ํตํฉ๋์ด ์น๊ณผ ์ฑ์์ ์ฌ์ฉ ๊ฐ๋ฅ * ๐ Premium ๋ฐ Premium+ ์ฌ์ฉ์๋ ๐ ๋ฐ Grok.com์์ Grok 3 ์ฌ์ฉ ๊ฐ๋ฅ * ๐ Premium+ ์ฌ์ฉ์๋ Think ๋ฐ DeepSearch์ ์ฆ์ ์ก์ธ์ค ๊ฐ๋ฅ * ์ํฐํ๋ผ์ด์ฆ ํํธ๋๋ฅผ ์ํ API๊ธฐ๋ฐ์ Deepsearch ์ถ์ ์์ * ์ ์ฉ ์น ํ๋ซํผ: https://grok.com/ * ์ฐธ๊ณ : https://www.youtube.com/watch?v=iE8IOS27Rr4 * source: https://x.ai/blog/grok-3