[0726]모두에게 전하는 모두연 AI뉴스!

  • AI, 최초로 국제 수학올림피아드에서 메달 획득

구글 딥마인드의 AlphaProof가 올해의 국제 수학올림피아드(IMO) 에서 은메달을 획득했습니다. 인공지능 모델 중 최초로 메달을 획득했다고 합니다. 올 1월, 딥마인드는 IMO의 기하학 문제와 인간에게 답할 수 있는 AI 시스템인 AlphaGeometry를 시연했습니다 . 그러나 시연은 라이브가 아니었고, IMO 메달을 따는 데 필요한 수론, 대수학, 조합론과 같은 다른 수학 분야의 문제에는 답할 수 없었습니다. 이에 구글 딥마인드에서는 이제 더 광범위한 수학 문제를 풀 수 있는 AlphaProof라는 새로운 AI와 더 많은 기하 문제를 풀 수 있는 AlphaGeometry의 개선된 버전을 출시했습니다. 연구자들이 올해의 IMO 문제에서 두 시스템을 함께 테스트했을 때, 6개 문제 중 4개에 정답을 맞혔고, 42점 만점에 28점을 받았습니다. 이는 은메달을 따기에 충분했고, 올해의 금메달 기준점보다 단 1점 낮았습니다. 한편, 1959년에 첫 개최된 국제 수학올림피아드는 국제 과학 올림피아드들 가운데 가장 큰 규모와 오래된 역사를 자랑하고 있으며, 학부 미만의 학생들을 대상으로 하는 수학 경시대회 중에서 가장 큰 규모와 위상을 가지고 있습니다. 이번 대회에서는 108개국에서 609명이 참가하였으며, 금메달은 58명, 은메달 121명, 동메달 145명이 수상하였습니다.


https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/


  • 개발자와 유사한 방식으로 상호작용하는 에이전트 개발 플랫폼 OpenDevin

인간 개발자처럼 코드 작성, 명령줄 조작, 웹 브라우징을 통해 세상과 상호작용하는 강력하고 유연한 AI 에이전트 개발 플랫폼 OpenDevin을 소개합니다! 이 플랫폼은 새로운 에이전트 구현, 안전한 샌드박스 환경에서의 코드 실행, 다중 에이전트 간 조정, 그리고 평가 벤치마크 통합을 가능케 합니다. OpenDevin은 개발자들과 상호작용하며 코드의 버그를 수정하거나 기능을 탑재할 수 있습니다. 통합된 벤치마크를 기반으로, 우리는 소프트웨어 엔지니어링(예: SWE-Bench)과 웹 브라우징(예: WebArena) 등을 포함한 15가지 벤치마크에서 우수한 성능을 보여주었습니다. OpenDevin은 지난 4월에 시작된 학계와 산업계에 걸친 커뮤니티 프로젝트로, 160명 이상의 기여자들로부터 1,300개 이상의 기여를 받았습니다.


https://github.com/OpenDevin/OpenDevin


AI 개발자 과정의 압도적인 수준 차이! 입문자에서 전공자까지! 아이펠 9기 모집중 : https://bit.ly/4ePP8iK

AI achieves silver-medal standard solving International Mathematical Olympiad problems

Google DeepMind

AI achieves silver-medal standard solving International Mathematical Olympiad problems

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 7월 26일 오전 2:52

댓글 0