Text2Image 로 만족하지 않는다. 이제 Text2Video다.
메타 AI에서 발표한 Make-A-Video가 화제입니다. 9월 20일 메타 AI의 공식 웹사이트에서 소개된 Make-A-Video는 텍스트 프롬프트를 짧은 고품질 비디오 클립으로 변환할 수 있는 새로운 AI 시스템입니다. 이 시스템은 짝을 이루는 텍스트-이미지 데이터에서 세상이 어떻게 생겼는지, 그리고 관련 텍스트가 없는 비디오 장면에서 세상이 어떻게 움직이는지 학습했습니다. 오픈AI의 DALL-E 2, Stability AI의 Stable Diffusion, Midjourney 등의 등장으로 텍스트로부터 이미지를 만드는 Text2Image는 이미 짧은 시간(겨우 2달 남짓!) 안에 대중화가 이루어지고 있고, 그 다음 단계라고 할 수 있는 비디오 및 3D 모델의 생성 기술이 어떻게 발전할지 모두 주목하는 가운데 메타 AI가 먼저 하나를 터뜨리네요. 정말 정신없는 속도로 기술의 고도화가 이루어지고 있습니다. 링크된 글에서 Make-A-Video의 데모 및 논문 링크 등을 확인할 수 있습니다.