Community

[0409]모두에게 전하는 모두연 AI뉴스!

* SmolVLM: 자원 효율성에 최적화된 소형 비전-언어 모델 시리즈 이 논문은 대형 비전-언어 모델(VLM)의 높은 성능과 자원 소모 문제를 해결하기 위해, 자원 효율적인 추론에 특화된 소형 멀티모달 모델 시리즈 'SmolVLM'을 소개합니다. 기존 소형 VLM들이 종종 비효율적인 대형 모델 설계를 따르는 것과 달리, SmolVLM은 낮은 계산 오버헤드에 최적화된 아키텍처 구성, 토큰화 전략, 데이터 큐레이션을 체계적으로 탐색하여 개발되었습니다. 그 결과, 가장 작은 256M 모델은 1GB 미만의 GPU 메모리로도 이미지 및 비디오 작업에서 우수한 성능을 보이며, 효율적인 엣지 디바이스 배포 가능성을 제시합니다. https://huggingface.co/papers/2504.05299 * 아이콘에서 복잡한 캐릭터까지: OmniSVG의 다재다능한 SVG 생성 능력 SVG(Scalable Vector Graphics)는 해상도 독립성과 편집 용이성으로 중요하지만, 고품질의 복잡한 SVG 생성은 어렵습니다. 기존 방법들은 계산 비용이 높거나 단순한 결과물만 생성하는 한계가 있었습니다. 이 논문은 사전 훈련된 비전-언어 모델(VLM)을 활용한 통합 SVG 생성 모델 'OmniSVG'를 제안합니다. OmniSVG는 SVG 명령어와 좌표를 이산 토큰으로 매개변수화하여 구조와 기하학 정보를 분리하고, 이를 통해 아이콘부터 복잡한 애니메이션 캐릭터까지 다채로운 SVG를 효율적으로 생성합니다. 또한, 2백만 개 규모의 데이터셋 MMSVG-2M과 평가 벤치마크를 함께 공개하며, 실험 결과 기존 방법들보다 우수한 성능을 보였습니다. https://huggingface.co/papers/2504.06263

알림

알림이 없습니다