Nvidia의 AI agent Eureka

엔비디아에서 유레카라는 로봇용 ai agent를 공개했습니다. 특히나 강화학습의 reward를 개발자가 지정하는 것이 아니라 llm을 기반으로 학습하도록 한 것이 특징이라고 보여집니다. https://eureka-research.github.io

Eureka | Human-Level Reward Design via Coding Large Language Models

eureka-research.github.io

Eureka | Human-Level Reward Design via Coding Large Language Models

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2023년 10월 23일 오후 9:58

댓글 0

    함께 읽은 게시물

    < 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

    1

    ... 더 보기

     • 

    댓글 1 • 저장 5 • 조회 728


    < 케이팝이 진짜 필요한 건 ‘숫자’가 아니다 >

    1. 저는 플랫폼/유통업계에서 엔터로 넘어왔어요. 엔터 시장에서 일하며 놀랐어요. 온라인 플랫폼과 커머스에서 CRM은 상식인데, 케이팝 업계에 CRM 개념이 없다는 사실에 큰 충격을 받았어요.

    ... 더 보기

    < 혁신의 첫 반응은 '박수'가 아니라 '야유'다 >

    1

    ... 더 보기