[0820] 모두에게 전하는 모두연 AI뉴스!

  • 긴 영상 속 3D 재현 한계 극복한 롱스플랫

중국의 양명교통대학교 및 엔비디아 리서치 연구팀이 카메라의 위치 정보 없이 촬영된 긴 영상으로도 고품질의 3D 모델을 만들 수 있는 새로운 기술인 ‘롱스플랫(LongSplat)’을 발표했습니다. 기존 기술들은 카메라의 움직임 정보가 필요하거나, 긴 영상에서 발생하는 오차 누적 및 메모리 문제로 인해 품질이 저하되는 한계가 있었습니다. 이에 연구팀은 카메라의 자세(포즈)와 3D 가우시안 스플래팅(3D Gaussian Splatting)을 동시에 최적화하는 방식을 도입했습니다. 롱스플랫은 새로운 프레임이 추가될 때마다 점진적으로 카메라 포즈와 3D 모델을 함께 개선해 나갑니다. 또한, 3D 구조를 효율적으로 관리하기 위해 옥트리(Octree) 기반의 앵커 형성 메커니즘을 적용, 대규모 장면에서도 메모리 사용량을 크게 줄였습니다. 이 기술은 다양한 벤치마크 테스트에서 기존 방법들보다 우수한 렌더링 품질과 정확한 포즈 추정 성능을 보였습니다. 롱스플랫은 VR, AR, 가상 관광 등 다양한 분야에서 활용될 수 있을 것으로 기대됩니다.


https://linjohnss.github.io/longsplat/


  • AI 시대의 새로운 언어, ‘프롬프트 오케스트레이션 마크업 언어(POML)’ 등장

대규모 언어 모델(LLMs)을 활용하는 데 있어 정교한 '프롬프트'의 중요성이 커지고 있지만, 현재의 방식은 구조화, 데이터 통합, 형식 민감성, 도구 부족 등 여러 문제에 직면해 있습니다. 복잡한 프롬프트를 구성하거나 다양한 데이터(문서, 표, 이미지 등)를 통합하는 데 어려움이 있었기 때문입니다. 이러한 한계를 극복하기 위해 프롬프트 오케스트레이션 마크업 언어(POML)가 새롭게 개발되었습니다. POML은 프롬프트 작성을 위한 종합적인 해결책을 제시합니다. 주요 특징으로는 크게 세 가지를 들 수 있습니다. 첫째, 역할, 작업, 예시 등을 명확히 구분하는 ‘컴포넌트 기반 마크업’을 통해 논리적인 구조를 만듭니다. 둘째, 데이터 형식을 가리지 않는 전용 태그로 다양한 데이터를 손쉽게 통합합니다. 셋째, 콘텐츠와 형식을 분리하는 ‘CSS 유사 스타일 시스템을 도입하여 프롬프트의 재현성을 높였습니다. 또한, 동적 프롬프트 생성을 위한 템플릿 기능과 버전 관리 및 협업을 돕는 개발자 도구 키트(IDE 지원, SDK)도 함께 제공됩니다. 연구팀은 두 가지 사례 연구와 사용자 연구를 통해 POML이 복잡한 애플리케이션 통합과 정확도 향상에 큰 효과를 보인다고 밝혔습니다.


https://github.com/microsoft/poml


실무 중심 AI 전문가 양성 과정 AI학교 아이펠 15기 : http://bit.ly/46SqcG4
경쟁력 있는 데이터 커리어를 만들고 싶다면? 데이터 사이언티스트 전문과정 6기 : http://bit.ly/4mICwNL

LongSplat

linjohnss.github.io

LongSplat

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2025년 8월 20일 오전 8:59

댓글 0