2023년 5월쯤 OpenAI에서 일리아 수츠케버가 참여한 “Let's Verify Step by Step”이라는 논문이 나왔었는데요.


이 논문의 내용은 최종 결과를 감독하는 것 보다 프로세스, 즉 추론 단계를 감독하는 것이 훨씬 좋은 결과를 낸다는 내용입니다. 특히 도전적인 수학 문제를 해결하는 데 있어서는 성능이 크게 증가하고요.


아마도 이 때 o1이 시작되고 있었던 것 같습니다.


더불어 대규모 모델이 소규모 모델에 대한 인간 감독을 근사할 수 있다는 OpenAI의 연구도 있었는데요. 발표자료의 몇 가지 결과를 보면 이 방식도 들어가 있지 않을까하는 추측도 한 번 해 봅니다.

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 9월 14일 오전 2:49

댓글 0

    함께 읽은 게시물

    품질 높은 프로젝트는 어떻게 만들어질까? 🤔

    ... 더 보기

    “품질 높은 프로젝트는 어떻게 만들어질까?”

    F-Lab : 상위 1% 개발자들의 멘토링

    “품질 높은 프로젝트는 어떻게 만들어질까?”

    성장이 어려운 환경에서의 개발자 생활

    저런 개발자 생활도 한적이 있어서 다양한 생각이 든다.

    “어이 신입, 탈출각이다” | 요즘IT

    요즘IT

    “어이 신입, 탈출각이다” | 요즘IT

    커리어를 쌓아야 할 때 알아야 하는 잔인한 사실들

    1

    ... 더 보기

     • 

    저장 77 • 조회 4,266


    상위 1% 파이썬 개발자가 사용하는 백엔드 레포지토리 TOP 8

    ... 더 보기

    🐍 8 backend repos used by the top 1% of python devs 🏆

    Medium

    🐍 8 backend repos used by the top 1% of python devs 🏆

    노력도 배신한다...250714

    1.●관계를 결정하는건 그 사람의 태도이다.
    2.●운이 안따른다고 생각이 들면 좀 기다려야 한다.

    ... 더 보기

     • 

    저장 2 • 조회 88