Paper page - Tuning-Free Multi-Event Long Video Generation via Synchronized Coupled Sampling
huggingface.co
AI 비디오 생성, SynCoS로 장거리 일관성을 잡다
최근 텍스트-비디오 디퓨전 모델은 단일 프롬프트에서 고품질의 짧은 비디오를 생성하지만, 실제 장면의 긴 비디오를 한 번에 생성하는 것은 여전히 어려운 과제입니다. 이러한 문제를 해결하기 위해 본 논문에서는 텍스트-비디오 디퓨전 모델을 튜닝 없이 긴 비디오 생성에 활용하는 새로운 추론 프레임워크인 SynCoS(Synchronized Coupled Sampling)를 제안합니다. SynCoS는 비디오 전체에서 노이즈 제거 경로를 동기화하여 인접 프레임과 멀리 떨어진 프레임 모두에서 장거리 일관성을 보장합니다. 또한, 매끄러운 로컬 전환과 글로벌 일관성을 보장하는 두 가지 상호 보완적인 샘플링 전략(역방향 및 최적화 기반 샘플링)을 결합합니다.
https://huggingface.co/papers/2503.08605
Gemma 3: 모두를 위한 AI, 어디서나 강력하게
Gemma 3는 워크스테이션, 노트북, 스마트폰에서 빠르고 효율적으로 실행되도록 설계되었으며, 개발자가 책임감 있는 AI 애플리케이션을 대규모로 구축하고 사용자에게 제공할 수 있도록 지원합니다. Gemma 3는 10억에서 270억 개의 파라미터 크기를 가진 다양한 모델로 구성되어 있으며, 특히 10억 개의 파라미터 버전을 포함하여 리소스 제약이 있는 장치에서도 AI를 실행할 수 있는 가능성을 열었습니다. Gemma 3는 140개 이상의 언어를 지원하며, 텍스트, 이미지, 비디오와 같은 다양한 입력을 처리할 수 있습니다. 또한, 128,000개의 토큰으로 컨텍스트 창이 크게 확장되어 더 많은 정보를 이해하고 처리할 수 있으며, 기능 호출 및 구조적 출력을 개선하여 다른 도구 및 서비스와의 통합이 용이합니다. Gemma 3는 특정 요구 사항에 맞게 쉽게 조정할 수 있으며, Google Colab, Vertex AI, 자체 GPU 등에서 미세 조정할 수 있습니다. Gemma 3는 Transformers, Jax, Keras, Ollama 등과 같은 인기 있는 프레임워크에서 지원되며, Nvidia, Hugging Face, AMD와 같은 업계 리더와의 파트너십을 통해 속도, 효율성 및 원활한 통합을 보장합니다.
https://blog.google/technology/developers/gemma-3/
[마감임박]
데이터와 AI로 미래를 예측하는 데이터 사이언티스트 4기 모집 : https://bit.ly/3WJ4C0A
다음 내용이 궁금하다면?
이미 회원이신가요?
2025년 3월 12일 오전 8:22