[구글] Genie - Text to Game

불과 얼마전 OpenAI가 Text to Video인 SORA로 전세계를 떠들썩였는데, 소리소문없이 구글이 생성형AI로 즉, 텍스트만 입력해서 게임을 만드는 Genie를 내놓았습니다. 아직은 소라나 지니가 짧은 영상이나 게임만 만들지만 향후 1시간 이상의 영상 제작이 가능해진다면 영상업계나 게임업계에 엄청난 파급 효과를 불러 일으킬 것으로 예상됩니다.

구글의 T2V 지니(Genie)
- 구글 딥마인드가 내놓은 대화형 비디오 게임 생성 인공지능
- 20만 시간의 무감독 공개 인터넷 게임 동영상으로 학습
- 액션이나 텍스트 주석에 대해 학습하지 않았음에도 불구하고 기본 모델은 주인공이 누구인지 결정하고 사용자가 생성된 월드에서 해당 캐릭터를 제어
- 잠재 액션 모델, 비디오 토큰화, 다이내믹스 모델
- 현재 1FPS로만 게임을 제작하는 등 몇 가지 제한
- 2D 플랫포머 게임과 로보틱스 동영상에 중점

주요 특징
- 액션 레이블 없이 제어 학습
  - 이미지의 어느 부분을 제어해야 하는지에 관한 레이블이 없는 인터넷 동영상에서 세분화된 컨트롤 학습
  - 관찰의 어떤 부분을 일반적으로 제어할 수 있는지 학습할 뿐만 아니라 생성된 환경 전체에서 일관된 다양한 잠재 동작을 추론
- 새로운 세대의 크리에이터 지원
  - 이미지 하나만 있으면 완전히 새로운 인터랙티브 환경 생성 가능
  - 최첨단 텍스트-이미지 생성 모델을 사용하여 시작 프레임 생성 > Genie로 생동감 있게 구현할 수 있는 등 가상 세계를 생성 > 가상 세계로 들어가는 다양하고 새로운 방법
  - Imagen2로 이미지를 생성하고 Genie를 사용하여 생동감 있게 구현
  - 스케치와 같이 사람이 직접 디자인한 창작물까지 생성
- 제너럴리스트 에이전트를 위한 디딤돌
  - 미래의 AI 에이전트를 끊임없이 생성되는 새로운 세계로 구성된 커리큘럼에서 훈련 가능
  - Genie가 학습한 잠재적 동작이 실제 인간이 설계한 환경으로 옮겨질 수 있다는 개념 증명
- 제너레이티브 가상 세계의 미래
  - 추가적인 도메인 지식 없이도 다양한 도메인에 적용 가능
  - 일관된 동작 공간을 학습
  - 인간이 설계한 시뮬레이터에서는 어려운 작업인 변형 가능한 객체를 시뮬레이션 가능
  - 이미지나 텍스트로 전체 인터랙티브 월드를 생성할 수 있는 시대 오픈
  - 미래의 제너럴리스트 AI 에이전트를 양성하는 촉매제

출처: 구글의 Genie - https://sites.google.com/view/genie-2024

🧞 Genie: Generative Interactive Environments

Google

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 2월 27일 오후 1:32

저장 1 • 조회 1,579

비슷한 게시물

주간 인기 TOP 10

장홍석 스페이스오디티 부대표/CPO

< 리더를 위한 효율적인 시간 쪼개기 기술 3가지 >

달레 Apollo GraphQL Software Engineer

🍞 Bun이 Anthropic의 가족이 되었습니다! 🎉

하조은 당근 Product Engineer

사이드 프로젝트에 날개를 달아준 클로드 코드

달레 Apollo GraphQL Software Engineer

📻 프로그래머를 위한 프로그래밍 팟캐스트, 달레줄레 🎙️

골빈해커 Chief Maker

📝 AI가 Anthropic의 업무 방식을 어떻게 바꾸고 있는가

기묘한 트렌드라이트 발행인

🚀쿠팡, 지금은 정말 피할 때가 아닙니다

Ruth Hyojin Nam 시니어 QA 매니저

[2부:적용편] 소프트웨어 테스팅에 AI 활용하기 2)

김병호 삼성 SDS

프로세스는 성공을 만들지 못하지만, 실패를 줄인다

빙빙빙 기획

실무진 검증 과제 기반 | 통신3사 마케팅전략 공모전 (~12/2

석민 커리어 코치

방법보다 방향이 중요해요

[구글] Genie - Text to Game

댓글 1

비슷한 게시물

주간 인기 TOP 10

추천 프로필