[0312]모두에게 전하는 모두연 AI뉴스!

AI 비디오 생성, SynCoS로 장거리 일관성을 잡다

최근 텍스트-비디오 디퓨전 모델은 단일 프롬프트에서 고품질의 짧은 비디오를 생성하지만, 실제 장면의 긴 비디오를 한 번에 생성하는 것은 여전히 어려운 과제입니다. 이러한 문제를 해결하기 위해 본 논문에서는 텍스트-비디오 디퓨전 모델을 튜닝 없이 긴 비디오 생성에 활용하는 새로운 추론 프레임워크인 SynCoS(Synchronized Coupled Sampling)를 제안합니다. SynCoS는 비디오 전체에서 노이즈 제거 경로를 동기화하여 인접 프레임과 멀리 떨어진 프레임 모두에서 장거리 일관성을 보장합니다. 또한, 매끄러운 로컬 전환과 글로벌 일관성을 보장하는 두 가지 상호 보완적인 샘플링 전략(역방향 및 최적화 기반 샘플링)을 결합합니다.

https://huggingface.co/papers/2503.08605

Gemma 3: 모두를 위한 AI, 어디서나 강력하게

Gemma 3는 워크스테이션, 노트북, 스마트폰에서 빠르고 효율적으로 실행되도록 설계되었으며, 개발자가 책임감 있는 AI 애플리케이션을 대규모로 구축하고 사용자에게 제공할 수 있도록 지원합니다. Gemma 3는 10억에서 270억 개의 파라미터 크기를 가진 다양한 모델로 구성되어 있으며, 특히 10억 개의 파라미터 버전을 포함하여 리소스 제약이 있는 장치에서도 AI를 실행할 수 있는 가능성을 열었습니다. Gemma 3는 140개 이상의 언어를 지원하며, 텍스트, 이미지, 비디오와 같은 다양한 입력을 처리할 수 있습니다. 또한, 128,000개의 토큰으로 컨텍스트 창이 크게 확장되어 더 많은 정보를 이해하고 처리할 수 있으며, 기능 호출 및 구조적 출력을 개선하여 다른 도구 및 서비스와의 통합이 용이합니다. Gemma 3는 특정 요구 사항에 맞게 쉽게 조정할 수 있으며, Google Colab, Vertex AI, 자체 GPU 등에서 미세 조정할 수 있습니다. Gemma 3는 Transformers, Jax, Keras, Ollama 등과 같은 인기 있는 프레임워크에서 지원되며, Nvidia, Hugging Face, AMD와 같은 업계 리더와의 파트너십을 통해 속도, 효율성 및 원활한 통합을 보장합니다.

https://blog.google/technology/developers/gemma-3/

[마감임박]
데이터와 AI로 미래를 예측하는 데이터 사이언티스트 4기 모집 : https://bit.ly/3WJ4C0A

Paper page - Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling

huggingface.co

다음 내용이 궁금하다면?

이미 회원이신가요?

2025년 3월 12일 오전 8:22

조회 115

비슷한 게시물

주간 인기 TOP 10

장홍석 스페이스오디티 부대표/CPO

< 리더를 위한 효율적인 시간 쪼개기 기술 3가지 >

달레 Apollo GraphQL Software Engineer

🍞 Bun이 Anthropic의 가족이 되었습니다! 🎉

하조은 당근 Product Engineer

사이드 프로젝트에 날개를 달아준 클로드 코드

달레 Apollo GraphQL Software Engineer

📻 프로그래머를 위한 프로그래밍 팟캐스트, 달레줄레 🎙️

골빈해커 Chief Maker

📝 AI가 Anthropic의 업무 방식을 어떻게 바꾸고 있는가

기묘한 트렌드라이트 발행인

🚀쿠팡, 지금은 정말 피할 때가 아닙니다

Ruth Hyojin Nam 시니어 QA 매니저

[2부:적용편] 소프트웨어 테스팅에 AI 활용하기 2)

김병호 삼성 SDS

프로세스는 성공을 만들지 못하지만, 실패를 줄인다

빙빙빙 기획

실무진 검증 과제 기반 | 통신3사 마케팅전략 공모전 (~12/2

석민 커리어 코치

방법보다 방향이 중요해요

[0312]모두에게 전하는 모두연 AI뉴스!

댓글 0

비슷한 게시물

주간 인기 TOP 10

추천 프로필