How People Are Really Using Gen AI in 2025
Harvard Business Review
효율적인 CoT 추론 기법 Stop Overthinking
라이스 대학교의 연구진이 효율적인 CoT 추론을 위한 서베이 논문을 발표했습니다!
최근 CoT 기반의 대형 모델들은 뛰어난 성능을 보여주고 있지만, 과도한 추론 길이로 Overthinking 현상이 계산 효율과 실용성 측면에서 한계로 지적되고 있습니다. 이런 문제들을 해결하기 위해 연구진은 기존 연구들을 구조적으로 정리합니다. 이 분류를 바탕으로하여, 연구진은 추론 모델을 간결하게 설계하거나 별도로 훈련을 진행하는 모델 기반, 추론 도중 불필요한 단계를 제거하는 출력 기반, 문제 난이도에 따른 출력 모델이나 입력 길이를 조절하는 프롬프트 기반이라는 세 가지 접근 방향에서 효율적 추론 기술들을 제시합니다. 또한 소형 언어모델의 추론 가능성, 효율적 학습 데이터 구성, 정교한 평가 및 벤치마킹 방법까지 포함하며, 향후 LLM 기반 추론의 실용화를 위한 연구 로드맵을 제시하고 있습니다.
https://arxiv.org/pdf/2503.16419
성능을 유지하며 경량화에 성공한 Qwen2.5-VL-32B-Instruct
알리바바 그룹의 Qwen 개발진이 QwenVL-2.5-72B를 기반으로 제작한 Qwen2.5-VL-32B-Instruct를 발표했습니다!
Qwen2.5-VL-32B-Instruct는 복잡한 도표나 양식 인식, 1시간 이상의 긴 영상을 이해하고 영상 내 이벤트를 포착할 수도 있습니다. 또한 객체 위치 지정 등 정밀한 멀티모달 작업을 처리할 수 있으며, JSON 기반의 구조화된 출력까지 지원해 다양한 비즈니스 응용 가능성을 열어줍니다. 강화학습을 통해 응답의 형식화와 인간 친화적 표현이 개선되었고, MMMU, MathVista, MM-MT-Bench 등 주요 벤치마크에서 상위 모델을 뛰어넘는 성과를 기록하며, Mistral-24B, Gemma-27B 등과의 비교에서도 우위를 보였습니다.
https://qwenlm.github.io/blog/qwen2.5-vl-32b/
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 3월 25일 오전 6:13
1
... 더 보기해외에서 직장인과 유학생을 경험하며 지내다보니 벌써 13년차가 되었네요. 요즘 IT 업계쪽에서 해외 취업을 많이 고민하시는 분들의 글이 보입니다.
한
... 더 보기