🧞 Genie: Generative Interactive Environments
불과 얼마전 OpenAI가 Text to Video인 SORA로 전세계를 떠들썩였는데, 소리소문없이 구글이 생성형AI로 즉, 텍스트만 입력해서 게임을 만드는 Genie를 내놓았습니다. 아직은 소라나 지니가 짧은 영상이나 게임만 만들지만 향후 1시간 이상의 영상 제작이 가능해진다면 영상업계나 게임업계에 엄청난 파급 효과를 불러 일으킬 것으로 예상됩니다.
구글의 T2V 지니(Genie)
구글 딥마인드가 내놓은 대화형 비디오 게임 생성 인공지능
20만 시간의 무감독 공개 인터넷 게임 동영상으로 학습
액션이나 텍스트 주석에 대해 학습하지 않았음에도 불구하고 기본 모델은 주인공이 누구인지 결정하고 사용자가 생성된 월드에서 해당 캐릭터를 제어
잠재 액션 모델, 비디오 토큰화, 다이내믹스 모델
현재 1FPS로만 게임을 제작하는 등 몇 가지 제한
2D 플랫포머 게임과 로보틱스 동영상에 중점
주요 특징
액션 레이블 없이 제어 학습
이미지의 어느 부분을 제어해야 하는지에 관한 레이블이 없는 인터넷 동영상에서 세분화된 컨트롤 학습
관찰의 어떤 부분을 일반적으로 제어할 수 있는지 학습할 뿐만 아니라 생성된 환경 전체에서 일관된 다양한 잠재 동작을 추론
새로운 세대의 크리에이터 지원
이미지 하나만 있으면 완전히 새로운 인터랙티브 환경 생성 가능
최첨단 텍스트-이미지 생성 모델을 사용하여 시작 프레임 생성 > Genie로 생동감 있게 구현할 수 있는 등 가상 세계를 생성 > 가상 세계로 들어가는 다양하고 새로운 방법
Imagen2로 이미지를 생성하고 Genie를 사용하여 생동감 있게 구현
스케치와 같이 사람이 직접 디자인한 창작물까지 생성
제너럴리스트 에이전트를 위한 디딤돌
미래의 AI 에이전트를 끊임없이 생성되는 새로운 세계로 구성된 커리큘럼에서 훈련 가능
Genie가 학습한 잠재적 동작이 실제 인간이 설계한 환경으로 옮겨질 수 있다는 개념 증명
제너레이티브 가상 세계의 미래
추가적인 도메인 지식 없이도 다양한 도메인에 적용 가능
일관된 동작 공간을 학습
인간이 설계한 시뮬레이터에서는 어려운 작업인 변형 가능한 객체를 시뮬레이션 가능
이미지나 텍스트로 전체 인터랙티브 월드를 생성할 수 있는 시대 오픈
미래의 제너럴리스트 AI 에이전트를 양성하는 촉매제
출처: 구글의 Genie - https://sites.google.com/view/genie-2024
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 2월 27일 오후 1:32
1. 이 책을 주면서 사랑하는 딸에게 말하고 싶다.
지난 주 고등학교 동창 몇몇을 만났을 때였다. 그 중 둘의 얼굴이 매우 어두웠다. 공교롭게도 그 날 직원들이 퇴사하겠다며 사표를 냈다고 했다. 청천벽력인 것 같았다. 자신들의 관리 책임으로 돌아올까 봐 걱정하는 눈치였다.
... 더 보기구성원들이 의욕적으로 협력하고 열정과 에너지가 느껴지는 팀과 조직이 있는 반면, 서로의 일에 무관심하고 타성과 매너리즘에 빠져 무기력하게 하루를 보내는 조직이 있다. 이렇게 차이가 나는 이유는 뭘까? 그것은 근본적으로 팀과 조직을 이끌어가는 리더의 에너지 상태가 다르기 때문이다.
... 더 보기1. 오랜만에 만난 사람은 늘 어색하다. 뭔가 말을 건네야 한다. 인사 없이 지나가긴 애매하다. 하지만 대화 주제는 많지 않다. 날씨, 뉴스 얘기 몇 마디는 어떻게 해본다. 하지만 가장 어려운 건 마무리다.
국내 최초 ‘창고형 약국’이 성남에 문을 열며 약국 유통 구조에 변화를 일으키고 있습니다💊
... 더 보기Cursor와 함께라면, 더이상 에디터는 단순한 입력 도구가 아닌
... 더 보기