[0205]모두에게 전하는 모두연 AI뉴스!

  • 데이터 확장의 한계 극복! OmniHuman, 두 가지 훈련 원칙으로 사람 동작 생성 능력 UP

이 논문에서는 다양한 조건에서 사람의 움직임을 사실적으로 생성하는 혁신적인 인공지능 모델인 OmniHuman을 제안합니다. 기존의 방법들은 훈련 데이터의 규모를 확장하는 데 어려움을 겪었지만, OmniHuman은 움직임과 관련된 다양한 조건을 훈련 단계에 혼합하여 데이터 규모를 효과적으로 확장합니다. 이를 위해 두 가지 훈련 원칙과 함께 모델 아키텍처 및 추론 전략을 소개합니다. OmniHuman은 사실적인 사람 비디오 생성을 가능하게 하고, 다양한 인물 콘텐츠, 동작, 객체 상호 작용 및 이미지 스타일을 지원합니다. 또한, 여러 가지 구동 모달리티를 지원하여 기존의 오디오 기반 방법보다 사실적이고 유연한 비디오 생성을 가능하게 합니다.


https://huggingface.co/papers/2502.01061


  • 별도 보상 모델 없이도 강력한 LLM 탄생! PRIME, 효율적인 온라인 PRM 업데이트 방식 제시

이 논문에서는 대규모 언어 모델(LLM)의 추론 능력을 향상시키기 위한 강화 학습 프레임워크인 PRIME을 제안합니다. PRIME은 암묵적 프로세스 보상을 사용하여 온라인에서 프로세스 보상 모델(PRM)을 효율적으로 업데이트하고, 다양한 이점 함수와 호환되며, 기존 방법에서 필요한 전용 보상 모델 훈련 단계를 생략합니다. 이를 통해 PRIME은 보상 해킹을 완화하고 개발 오버헤드를 줄입니다. 실험 결과, 경쟁 수준의 수학 및 코딩 작업에서 PRIME의 효과가 입증되었습니다. Qwen2.5-Math-7B-Base에서 시작하여 여러 주요 추론 벤치마크에서 SFT 모델에 비해 평균 15.1% 향상되었습니다. 특히, 결과 모델인 Eurus-2-7B-PRIME은 훈련 데이터의 10%만 사용하여 7개의 추론 벤치마크에서 Qwen2.5-Math-7B-Instruct를 능가했습니다.


https://huggingface.co/papers/2502.01456


2017년부터 명맥을 이어온 AI명문
아이펠리서치 온라인13기 사전등록 : https://bit.ly/4jzwrSS

Paper page - OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

huggingface.co

Paper page - OmniHuman-1: Rethinking the Scaling-Up of One-Stage Conditioned Human Animation Models

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 2월 5일 오전 8:15

댓글 0

    함께 읽은 게시물

    👋 디자이너도 앱을 만들 수 있을까?

    ... 더 보기

    디자이너도 앱을 만들 수 있을까?

    Brunch Story

    디자이너도 앱을 만들 수 있을까?

    노션 템플릿들을 만들면서 적는 회고

    ... 더 보기