소라(Sora), 누구나 텍스트로 비디오를 만드는 놀라운 서비스 ... 오픈AI
트렌드와칭
오픈AI가 또 하나의 역작(?)으로 내놓은 소라(Sora) 관련 글들이 많이 올라오는 거 같습니다. 간략하게 잘 정리해둔 글이 공유해봅니다.
소라(Sora)
https://openai.com/sora
오픈AI가 만든 텍스트를 통해 사실적이고 상상력이 풍부한 비디오 장면을 만들 수 있는 Ai 모델, 이용자의 요청에 따라 최대 1분 길이의 비디오 생성
소라 = '하늘'을 뜻하는 일본어, 연구원 팀 브룩스(Tim Brooks)와 빌 피블스(Bill Peebles)를 포함한 기술 개발팀은 "무한한 창의적 잠재력을 연상시키는 이름"
주요 기능
최대 1분 비디오 생성
실제 상호작용이 필요한 문제를 해결하는데 도움이 되는 모델을 학습시키는 것을 목표로 움직이는 물리적 세계를 이해하고 시뮬레이션하는 방법을 AI에게 학습시킴
제한된 이용자들에 의한 테스트 중
레드팀원들이 중요한 영역의 피해나 위험을 테스트하고 평가하는데 이용할 수 있도록 제공
크리에이티브 전문가에게 가장 도움이 되도록 모델을 발전시키는 방법에 대한 피드백을 얻기 위해 시각 예술가, 디자이너, 영화 제작자에게 액세스 권한을 부여
폼 비디오에 최적화
1분 영상이라면 유튜브 쇼츠, 인스타그램 릴스, 틱톡 영상 등에 충분히 활용
실제 세계의 사물에 대한 이해
여러 캐릭터, 특정 유형의 동작, 피사체와 배경의 디테일이 포함된 복잡한 장면 생성 가능
매력적인 캐릭터 생성 가능
언어에 대한 깊은 이해를 바탕으로 프롬프트를 정확하게 해석하고 생동감 넘치는 감정을 표현하는 매력적인 캐릭터를 생성
현재 모델의 약점
복잡한 장면의 물리적 특성을 정확하게 구현하는데는 어려움을 겪을 수 있음
원인과 결과로 연결되는 특정 사례를 이해하지 못할 수도 있음
왼쪽과 오른쪽을 혼동하는 등 프롬프트의 공간적 세부 사항 혼동 가능성
시간에 따라 발생하는 이벤트를 정확하게 표현하는데 어려움
챗GPT 3.5에서 발생했던 환각(=할루시네이션)과 같은 현상이 비디오 생성에서도 발생되는 것으로 이해
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 2월 23일 오전 7:40