Community

구글, 새로운 인공지능(AI) '로봇 트랜스포머 2(RT-2)발표

구글 딥마인드(Google DeepMind)가 대화형 인공지능 바드(Bard), 챗GPT(ChatGPT) 등과 같이 유사한 AI 기술을 통해 로봇 작업에서 자연어를 사용해 로봇을 제어할 수 있는 세계 최초의 '시각-언어-행동(vision-language-action, VLA)' 모델 'RT-2'를 지난 28일(현지시간) 공개한 것이다. RT-2는 VLM(시각 언어 모델)이 로봇 데이터와 VLM 사전 훈련을 결합하여 로봇을 프롬프트(지시어)를 통해 직접 제어할 수 있는 강력한 VLA(시각 언어 행동) 모델로 변환될 수 있음을 보여준 것으로 PaLM-E 및 PaLI-X를 기반으로 한 VLA의 두 가지 인스턴스화를 통해 기존의 VLM 모델에 대한 간단하고 효과적인 수정일 뿐만 아니라 실제 환경에서 다양한 작업을 수행하기 위해 추론하고, 문제를 해결하고, 정보를 해석할 수 있는 다양한 산업에서의 물리적 로봇을 구축할 가능성을 열어 준 것이다. >> 보다 상세한 내용은 원문을 참고해주세요~플리즈~^^

알림

알림이 없습니다