골빈해커

Chief Maker

LLM의 선호도를 끌어내어 내적 보상 모델을 구축하고, 이를 통해 강화 학습으로 에이전트를 훈련시키는 Motif.

NetHack 게임으로 실험을 했는데, 내적 보상을 극대화하도록 학습한 방법이, 점수 자체를 극대화하는 방법보다 높은 게임 점수를 달성했다고 하네요.

AI의 내적 선호도를 이용하는 보상 모델이라니.. 이건 좀.. 위험할지도..? 😬

https://arxiv.org/abs/2310.00166

더 많은 콘텐츠를 보고 싶다면?

이미 회원이신가요?

2023년 10월 26일 오전 6:57

•

저장 17 • 조회 2,790

함께 읽은 게시물

데이터리안

Data Analyst

2024년 07월 02일

데이터 분석가 첫 커리어는 어떤 회사에서 시작해야 할까요? 🤔

데

조회 1,323

달레

Apollo GraphQL Software Engineer

5일 전

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

지

달레의 코딩 테스트

www.youtube.com

저장 24 • 조회 3,175

조용구

Senior Front-end Engineer

19시간 전

https://html-eslint.org/docs/rules/use-baseline

ESLint plugin for linting HTML.

html-eslint.org

조회 650

골빈해커

Chief Maker

4월 25일

딥러닝/LLM 모델은 기본적으로는 Stateless한 상태지만, 대부분 프롬프트와 출력을 계속 되먹임하면서 작업을 이어가기 때문에 여러 턴으로 이루어진 태스크에서는 Stateful 하다고 볼 수 있습니다.

이런 것을 In-context learning 이라고 합니다.

저장 4 • 조회 2,923

K리그 프로그래머

커피한잔 개발자

3일 전

작은 성공의 기쁨

목

작은 성공의 기쁨

K리그 프로그래머

저장 1 • 조회 1,426

황민호

Kakao General Developer

2024년 03월 17일

React 면접 전 살펴보기 위한 Q&A 40가지 (2024년 ver)

Top 40 ReactJS Interview Questions and Answers in 2024 | Simplilearn

Simplilearn.com

•

댓글 1 • 저장 218 • 조회 11,576

비슷한 게시물

김선호 여기어때컴퍼니 / User Behavior Team Lead

LLM으로 대전게임하기

영현 GeoAI 연구원

📌 민속 놀이를 잘 하는 AI

마우스마우스 디자이너

피그마 AI에 대한 단상

골빈해커 Chief Maker

LLM은 지난 2년간, 성능은 원숭이 수준에서 인간 수준으로 높아졌고 가격은 400배 저렴해졌으며, 추론 속도는 지난 6년간 (이론적으로)3,000배 빨라졌다.

골빈해커 Chief Maker

워털루 대학의 한 학생이 AI(정확히는 Claude)의 도움을 받아 방구석에서 일주일만에 소형 원자로(feat. 아크 리액터)를 만들어냈다고 합니다. 😳

골빈해커 Chief Maker

📝 음성으로 전신 동작(영상)을 생성하는 메타의 AI, Audio to Photoreal

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

개발자의 장애 공유 문화

석민 커리어 코치

위로

장홍석 스페이스오디티 부대표/CPO

< 뇌를 가장 빠르게 바꾸는 3가지 방법 >

달레 Apollo GraphQL Software Engineer

Dependabot을 통한 안전한 의존성 관리

레드버스백맨 리서처 앤 라이터

⟪스토리를 만드는 사람들⟫

우디디자인랩 대표ㅣ프로덕트 디자이너

브런치에서의 6년, 그리고 100만뷰

골빈해커 Chief Maker

📰 인공지능만으로 운영된 스타트업의 실패 카네기 멜론 대학교의

골빈해커 Chief Maker

ChatGPT의 Deep Researh에 GitHub을 연결 할

동크루트 AI 엔지니어, SW 엔지니어

5월 둘째주 - OpenAI 인수부터 마소에 반기까지. 다 하는군

이양일 NaverCloud 백엔드 개발자

주니어 개발자들이 읽으면 좋은 테크 아티클 모음📚

댓글 0

함께 읽은 게시물

데이터 분석가 첫 커리어는 어떤 회사에서 시작해야 할까요? 🤔

🎯 유튜브에 100번째 코딩 테스트 문제 풀이 영상을 올렸습니다!

작은 성공의 기쁨

React 면접 전 살펴보기 위한 Q&A 40가지 (2024년 ver)

비슷한 게시물

주간 인기 TOP 10

추천 프로필