🗞️ OpenAI의 차세대 시스템인 Q*(큐-스타)에 대한 추가 정보

Q*는 복잡한 문제 해결 과정에서 발생하는 인간의 내적 사고 과정을 모방하여, 더 깊은 분석을 가능케 한다고 합니다. 이를 통해 복잡한 문제나 장기 계획에 대해서도 더 나은 의사 결정을 내릴 수 있다고 합니다.

Q*는 전통적인 토큰 예측 방식이 아닌, 에너지 기반 모델(EBM)을 사용한다고 하는데요.

간단하게 설명하자면, 주어진 질문에 대한 응답의 적합성을 스칼라 값으로 평가하고, 이 값을 응답의 "에너지"로 하여, 에너지가 낮으면 적합성이 높고 (좋은 답변), 에너지가 높으면 적합성이 낮은 (나쁜 답변) 것으로 평가하는 방식입니다.

따라서 Q*는 가능한 답변을 전체적으로 평가하기 때문에, 토큰의 순차적 예측을 넘어 프롬프트에 대한 답변의 기본적인 관련성과 적절성을 이해할 수 있게 됩니다.

여기서 Q*의 혁신은 텍스트 문자열의 공간이 아닌, 추상적 표현 공간 내에서 최적화 과정이 이루어진다는 데 있다고 하는데요.

기본적으로 경사 하강법을 적용하여 프롬프트와 관련하여 가장 낮은 에너지를 생성하는 표현을 점진적으로 찾는다고 합니다.

그 다음, 최적의 추상적 표현을 찾아내면, Q*는 자동 회귀 디코더(GPT)를 사용하여 이를 일관된 텍스트 응답으로 변환하여 사용자에게 제공합니다.

아주 정확한 비유는 아니지만, 마치 GPT-4 Vision이 이미지를 텍스트로 설명하는 과정과 유사한 방식이라고 보면 될 것 같습니다.

이 설명을 보면서 OpenAI가 최근에 내 놓은 동영상 생성 모델인 Sora가 생각났는데요. 이 유출된 내용이 맞다면 아마도 Sora는 Q*를 연구하면서 만들어진 부수적인 결과물이 아닐까 싶습니다.

아무튼, 이 설명에 따르면 이제 정말로 인간의 사고 과정을 모방한다는 말이니 정말로 AGI가 나올 날도 얼마 남지 않은게 아닐까 싶습니다.

며칠 전 진행된 Sam Altman의 인터뷰에 따르면, GPT-4의 다음 버전을 뭐라 부를지 정해지진 않았지만, GPT-3에서 GPT-4 정도 수준의 큰 변화가 있을

것이라고 예고 했는데요. 이에 따르면 유출된 이 내용이 진짜일 수도 있지 않을까 싶습니다.

여러 소식통에 의하면 이 다음 버전은 2분기 후반이나 3분기쯤 출시 될거라는 루머가 있는데요. 관객석에 있는 저는 그동안 팝콘이나 한빠께스 튀기고 있어야겠습니다. 😎🍿🥤

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 3월 20일 오후 5:13

저장 9 • 조회 3,077

장홍석 스페이스오디티 부대표/CPO

< 리더를 위한 효율적인 시간 쪼개기 기술 3가지 >

달레 Apollo GraphQL Software Engineer

🍞 Bun이 Anthropic의 가족이 되었습니다! 🎉

하조은 당근 Product Engineer

사이드 프로젝트에 날개를 달아준 클로드 코드

달레 Apollo GraphQL Software Engineer

📻 프로그래머를 위한 프로그래밍 팟캐스트, 달레줄레 🎙️

골빈해커 Chief Maker

📝 AI가 Anthropic의 업무 방식을 어떻게 바꾸고 있는가

기묘한 트렌드라이트 발행인

🚀쿠팡, 지금은 정말 피할 때가 아닙니다

Ruth Hyojin Nam 시니어 QA 매니저

[2부:적용편] 소프트웨어 테스팅에 AI 활용하기 2)

김병호 삼성 SDS

프로세스는 성공을 만들지 못하지만, 실패를 줄인다

빙빙빙 기획

실무진 검증 과제 기반 | 통신3사 마케팅전략 공모전 (~12/2

석민 커리어 코치

방법보다 방향이 중요해요