2023년 5월쯤 OpenAI에서 일리아 수츠케버가 참여한 “Let's Verify Step by Step”이라는 논문이 나왔었는데요.


이 논문의 내용은 최종 결과를 감독하는 것 보다 프로세스, 즉 추론 단계를 감독하는 것이 훨씬 좋은 결과를 낸다는 내용입니다. 특히 도전적인 수학 문제를 해결하는 데 있어서는 성능이 크게 증가하고요.


아마도 이 때 o1이 시작되고 있었던 것 같습니다.


더불어 대규모 모델이 소규모 모델에 대한 인간 감독을 근사할 수 있다는 OpenAI의 연구도 있었는데요. 발표자료의 몇 가지 결과를 보면 이 방식도 들어가 있지 않을까하는 추측도 한 번 해 봅니다.

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 9월 14일 오전 2:49

댓글 0

    함께 읽은 게시물

    PM의 '사고 파트너(thought partner)'로서 AI

    ... 더 보기

    사고 파트너(thought partner)로서 AI

    Brunch Story

    사고 파트너(thought partner)로서 AI

    한때 천만원에 거래되었던 Manus, Bedrock 무료 오픈소스로 공개

    ... 더 보기

    LinkedIn

    lnkd.in

    LinkedIn

     • 

    저장 21 • 조회 1,607