사고 파트너(thought partner)로서 AI
Brunch Story
2023년 5월쯤 OpenAI에서 일리아 수츠케버가 참여한 “Let's Verify Step by Step”이라는 논문이 나왔었는데요.
이 논문의 내용은 최종 결과를 감독하는 것 보다 프로세스, 즉 추론 단계를 감독하는 것이 훨씬 좋은 결과를 낸다는 내용입니다. 특히 도전적인 수학 문제를 해결하는 데 있어서는 성능이 크게 증가하고요.
아마도 이 때 o1이 시작되고 있었던 것 같습니다.
더불어 대규모 모델이 소규모 모델에 대한 인간 감독을 근사할 수 있다는 OpenAI의 연구도 있었는데요. 발표자료의 몇 가지 결과를 보면 이 방식도 들어가 있지 않을까하는 추측도 한 번 해 봅니다.
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 9월 14일 오전 2:49
누
... 더 보기한
... 더 보기