Introducing Qwen2-Math
Qwen
m수학 잘하는 모델의 수학 특화 모델, Qwen2-Math 출시
LLM이 많은 영역에서 좋은 성능을 보여줬었지만, 수학과 프로그래밍 문제는 난제로 남아있습니다. 이 문제들에서 Qwen 시리즈는 지속적으로 GPT, Claude 등의 상업모델과 오픈모델 사이에서 좋은 성능을 보여주었습니다. Qwen2-Math 는 Qwen2-instruct를 기반으로 제작되었으며, Qwen2 72B 모델을 기반으로 수학에 특화된 reward model을 훈련시킨 후, 모델이 잘 대답했는지를 반영시켰습니다. Qwen2는 MATH 벤치마크에서 제로샷 테스트로 GPT-4o 및 Claude 3.5의 성능을 능가하였으며, GSM8K, MMLU STEM등의 주요 벤치마크에서 Deepseek, Llama3의 성능 또한 최소 9%의 차이로 뛰어넘었습니다. 또한 Qwen2-Math는 7B, 1.5B의 소형 모델 또한 동시에 출시되었습니다. 이 모델들은 성능이 비슷하거나 더 큰 Deepseek, Internlm-math군의 모델들의 퍼포먼스를 최대 15% 상회하는 결과를 보여주었습니다.
https://qwenlm.github.io/blog/qwen2-math/
인공지능 에이전트 활용을 위한 과제 지향적 연구를 제안하다, SD-3D
인공지능 에이전트를 실생활에 활용하기 위해서는 인공지능에게 순차적으로 작업을 지시할 수 있어야 합니다. 자연어 명령을 인공지능이 판단하고, 3D 객체 탐지로 실제 세계를 판독하여 작업을 수행하게 됩니다. 그런데 현재 물리적인 3D환경 인지를 훈련하기 위한 데이터셋과 생성된 모델들은 주로 정적이고 객체 중심적인 설명에서 객체를 식별하고 위치를 파악하는 데 중점을 둡니다. 이러한 접근 방식은 실제 응용에 필요한 과제(TASK) 지향적인 동적이고 순차적인 특성을 적절히 다루지 못합니다. 이에 중국 북경대와 청화대 공동 연구진은 3D 장면에서의 과제 지향적 순차적 GROUNDING 을 새로운 연구 분야로 제안하고, 이 연구를 위한 데이터셋을 함께 소개합니다. 이 연구 분야를 수행하기 위해, 인공지능 에이전트는 실내 장면에서 일련의 목표 객체들을 찾아 일상적인 활동을 완수하기 위해 상세한 단계별 지시를 따라야 합니다. 이 연구를 위해 함께 소개된 데이터셋 SG3D는 4,895개의 실제 3D 장면에 걸쳐 22,346개의 과제와 112,236개의 단계를 포함하는 대규모 데이터셋입니다. 이 데이터셋은 다양한 3D 장면 데이터셋의 RGB-D 스캔과 자동화된 과제 생성 파이프라인을 결합하여 구축되었으며, 품질 보증을 위해 인간의 검증을 거쳤습니다. 우리는 최첨단 3D Visual grounding 모델 세 가지를 연구 과제에 맞게 조정하고 SG3D에서 그 성능을 평가하였으며, 추가 연구가 필요함을 제안합니다.
https://sg-3d.github.io/
사전 신청 후 과정 입학하면 데이터 분야 참고 서적 증정! 데이터사이언티스트 과정 지원하기: https://bit.ly/3YBFXNf
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 8월 9일 오전 2:41
1. 질문에 대한 답을 제공하는 일을 돈벌이로 삼는 사람은 상대가 누구라도 질문이 같으면 같은 대답을 합니다.
1. 커리어를 선택하는 기준은 다양하다. 일단 내가 가진 가치관이 가장 큰 영향을 준다. 남들의 시선과 판단도 무시할 수 없다. 이직 트렌드와 경향도 살펴봐야 한다.
... 더 보기“뜻밖에 아주 야비하고 어이없는 일을 당하더라도 그것 때문에 괴로워하거나 짜증내지 마라. 그냥 지식이 하나 늘었다고 생각하라. 인간의 성격을 공부해가던 중에 고려해야 할 요소가 새로 하나 나타난 것뿐이다. 우연히 아주 특이한 광물 표본을 손에 넣은 광물학자와 같은 태도를 취하라.” 현대판 마키아벨리라 불리는 로버트 그린의 책 <인간 본성의 법칙>은 쇼펜하우어의 말을 인용하는 것으로 시작한다.
... 더 보기D
... 더 보기공식적으로 뭐하는 회사인지는 모르지만 일단 100억달러 기업가치
... 더 보기