2023년 5월쯤 OpenAI에서 일리아 수츠케버가 참여한 “Let's Verify Step by Step”이라는 논문이 나왔었는데요.


이 논문의 내용은 최종 결과를 감독하는 것 보다 프로세스, 즉 추론 단계를 감독하는 것이 훨씬 좋은 결과를 낸다는 내용입니다. 특히 도전적인 수학 문제를 해결하는 데 있어서는 성능이 크게 증가하고요.


아마도 이 때 o1이 시작되고 있었던 것 같습니다.


더불어 대규모 모델이 소규모 모델에 대한 인간 감독을 근사할 수 있다는 OpenAI의 연구도 있었는데요. 발표자료의 몇 가지 결과를 보면 이 방식도 들어가 있지 않을까하는 추측도 한 번 해 봅니다.

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 9월 14일 오전 2:49

댓글 0

    함께 읽은 게시물

    Amazon CEO가 얘기하는 성공적인 커리어를 위한 최고의 팁 5가지


    ... 더 보기

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

    www.aboutamazon.com

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

     • 

    저장 10 • 조회 1,641


    많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.

    ... 더 보기

     • 

    저장 10 • 조회 1,640


    🗞️ 간밤에 구글이 Gemini 2.5 Pro를 출시했는데요. 벤치마크 상으로는 GPT-4.5와 Claude 3.7 의 성능을 크게 뛰어넘는 결과를 보여줍니다. 특히 코딩능력이 매우 크게 향상되었는데요.

    ... 더 보기

     • 

    저장 2 • 조회 1,598


    [CBInsight] AI 에이전트 시장 현황 및 전망

    ... 더 보기

    Boosted.ai - AI Built For Investment Management

    Boosted.ai

    Boosted.ai - AI Built For Investment Management

     • 

    저장 7 • 조회 2,450


    지식 공유 (1)

    

    ... 더 보기

    조회 407