OpenAI의 새로운 모델 GPT o1
OpenAI가 새로운 모델 GPT o1을 공개했습니다. GPT o1은 고난이도 추론에 특화된 모델로, 답변을 반환하기 전에 Chain of Thought를 수행합니다. 모델이 현재의 추론 과정이 정확하지 않다고 판단하면, OpenAI의 강화 학습 접근 방식에 따라 이를 인정하고 '다른 접근 방식을 시도'할 수 있다는 것입니다. OpenAI는 블로그를 통해 GPT o1은 국제 수학 올림피아드(IMO) 예선 시험에서 83%의 성적을 받아, 이전 모델인 'GPT-4o'의 13%를 크게 넘어섰으며, 코딩 능력을 가리는 Codeforces 에서도 89번째 백분위에 오르는 등 수학과 프로그래밍 등의 벤치마크에서 강점을 보인다고 밝혔습니다. GPT o1은 전작 GPT-4o 대비 MATH 벤치마크에서 34%의 향상을, MathVista와 MMMU에서 10%의 향상을 보였으며, 안정성 또한 크게 강화되어 탈옥 테스트에서 GPT-4o의 22점 대비 84점을 기록하였습니다. AI 커뮤니티에서는 GPT o1이 물리학, 화학, 생물학 등 까다로운 벤치마크 과제에서 박사 과정 학생과 비슷한 수준을 보이며, AGI로 한발짝 더 가까워졌다고 평가하고 있습니다.
한편, OpenAI는 해당 방식으로 코딩을 전문적으로 추론할 수 있는 모델 GPT o1 mini도 병행 출시했습니다.
https://openai.com/index/introducing-openai-o1-preview/
신뢰할 수 있는 구글의 언어모델 DataGemma
구글에서 Gemma의 새로운 타입인 DataGemma를 발표했습니다! 연구자들은 UN, WHO, CDC, 인구조사국과 같은 신뢰할 수 있는 기관에서 공개 정보를 소싱하여 방대한 지식 그래프인 Data Commons 를 구축하였으며, DataGemma는 이를 기반으로 실제 데이터와 연결하여 답을 내놓도록 설계되었습니다. DataGemma는 Data Commons에 RIG(Retrieval-Interleaved Generation)를 통하여 접근, 통계 데이터의 인스턴스를 식별하고 Data Commons에서 답을 검색하도록 프로그래밍되었습니다. 또한, DataGemma는 RAG(Retrieval-Augmented Generation) 를 사용하여 훈련 데이터 외에도 관련 정보를 통합하고, 더 많은 맥락을 흡수하며, 보다 포괄적이고 유익한 출력을 제공할 수 있습니다. 기본 모델 대비 RIG와 RAG를 사용한 DataGemma의 User Preference는 7B 모델에서 62%, 27B 모델에서 76%의 선호우위를 보였으며 (101 sample), RAG 사용 시 각각 92% (24 sample), 100% (29 sample)을 기록하였습니다.
https://blog.google/technology/ai/google-datagemma-ai-llm/
이론과 실무를 잇-다!
데이터로 비즈니스 가치를 만드는 데이터 사이언티스트 전문 과정 모집 중 : https://bit.ly/3YBFXNf
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 9월 13일 오전 8:01