OpenAI의 연구원의 말에 따르면, LLM 모델의 파라미터의 대부분은 단순한 지식을 담고 있을 뿐이라서 추론 능력을 향상 시키기 위해 모델의 크기를 더 키울 필요는 없다고 합니다. (수백, 수천억 이상을 말하는 것이겠죠)


더불어 LLM의 추론 능력이 충분히 뛰어나면, 지식 정보는 외부에서 끌어와서 RAG로 해결하면 되니 AI가 지식을 기억해 둘 필요가 없기 때문에 더욱 그렇고요.


그걸 일찌감치 발견했기에 SearchGPT를 개발하기 시작한 것 같네요.


그리고 최적해를 찾기 위한 시뮬레이션을 깊게 오래 할 수록 더 좋은 답변을 찾을 수 있기 때문에, 이에 따라 이제 학습 보다는 추론 시간에 더 많은 컴퓨팅 자원을 사용하는 패러다임으로 쉬프트하게 될 것이라고 하네요.


o1은 GPT-4 보다는 GPT3.5가 나왔을 때와 같은 느낌으로, AI 학습과 사용에 큰 패러다임 변화가 생긴 것 같은데요. 특히 RAG/Agent 구조의 변화와 로컬/서버 모델의 용처 구분이 좀 더 분명해 질 것 같습니다. o2는 진짜 AGI에 가까워질까요? 과연 앞으로 또 어떤 재미난 일들이 생길지 기대됩니다. 😎🍿🥤

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 9월 13일 오전 12:57

댓글 0

    함께 읽은 게시물

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기

    ... 더 보기

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

    Medium

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

     • 

    저장 39 • 조회 3,206


    바이브 코딩이야말로 진정한 애자일이 아닌가.

    조회 2,607


    작은 브랜드는 이걸 보셔야 해요.

    브랜드와 고객 사이에 ‘접점’이 있어요.
    채널로는 웹, SNS, 오프라인,광고, 디지털 채널들.

    ... 더 보기

    한시간 반만에 Cursor로 만든 개발서적 경매서비스 후기

    ... 더 보기

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

    jasonkang14.github.io

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

     • 

    저장 38 • 조회 3,787


    업계에 필요한 사람이 되자

    ... 더 보기

    업계에 필요한 사람이 되자

    Brunch Story

    업계에 필요한 사람이 되자

     • 

    저장 6 • 조회 1,123


    많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.

    ... 더 보기

     • 

    저장 8 • 조회 1,254