김성혁

테크 리드

[230922] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

🩵 모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다. 그럼, 오늘의 AI 뉴스 시작해 볼게요! 1️⃣ [대규모 언어 모델의 압축 능력: Chinchilla 70B의 성능 평가 및 응용](https://huggingface.co/papers/2309.10668) 예측 모델을 압축기로 변환하는 것은 확립된 개념이며, 최근 대규모 언어 모델의 훈련이 강조되었습니다. 이러한 모델은 높은 예측 능력을 가지기 때문에 효과적인 압축기로 작용할 수 있습니다. 이 연구에서는 대규모 언어 모델의 압축 능력을 중점으로 평가하였으며, 결과로 Chinchilla 70B는 특정 도메인 압축기보다 더 높은 압축 효율을 보였습니다. 또한, 예측과 압축의 동등성을 통해 gzip과 같은 기존 압축기를 사용하여 조건부 생성 모델을 구축할 수 있음을 제시하였습니다. 2️⃣ [LLM의 RLHF 최적화: 어드밴티지 모델과 선택적 리허설의 도입](https://huggingface.co/papers/2309.10202) 대규모 언어 모델(LLM)은 자연어 처리 분야에 혁신을 가져왔으나, RLHF를 통해 모델을 인간의 가치와 선호도에 맞게 조절하는 것은 큰 도전과제로 남아있습니다. 이 도전과제는 보상 해킹과 치명적인 망각 같은 문제들을 포함하고 있습니다. 이를 해결하기 위해 두 가지 혁신적인 방안을 제안합니다: 1) 어드밴티지 모델은 보상 해킹을 방지하기 위해 예상되는 보상과 추가 보상의 차이를 모델링합니다. 2) 선택적 리허설은 치명적인 망각을 줄이기 위해 특정 데이터를 선택하여 PPO 훈련과 지식을 재구성합니다. 이 방법들은 실험 결과 안정성을 높이고, 더 높은 보상 점수와 승리율을 달성하였습니다. 3️⃣ [언어 에이전트 연구: AGENTS 라이브러리와 프레임워크의 소개](https://huggingface.co/papers/2309.07870) 이 논문은 언어 에이전트(language agents)에 대한 연구를 다룹니다. 큰 언어 모델(Large Language Models, LLMs)은 ChatGPT와 같은 도구를 통해 환경, 인간 또는 다른 에이전트와 상호 작용하며 복잡한 작업을 자동으로 해결할 수 있는 자율 에이전트를 구축하는 데 사용됩니다. 이러한 언어 에이전트는 인공 일반 지능(AGI)로의 약속된 단계이며 고객 서비스, 컨설팅, 프로그래밍, 글쓰기, 교육 등의 역할에서 인간의 노력을 줄일 수 있습니다. 이 논문에서는 AGENTS라는 언어 에이전트를 위한 오픈 소스 라이브러리와 프레임워크를 소개합니다. AGENTS의 주요 목표는 언어 에이전트의 사용자 정의, 조정 및 배포를 비전문가에게도 간단하게 만드는 것입니다. 또한, 이 라이브러리는 언어 에이전트에 대한 다양한 프레임워크로서의 주요 기능을 제공합니다. — 🥇 K-디지털 트레이닝 훈련기관 최초! '대통령 표창' 수상한 모두의연구소의 AI학교 아이펠 입학하기 → https://bit.ly/3YDkLV4

AI학교 아이펠 - 부트캠프와 다른 AI학교

AI학교 아이펠

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 9월 22일 오전 12:50

저장 2 • 조회 573

함께 읽은 게시물

석민

커리어 코치

2일 전

스펙을 뛰어넘는 힘

저장 6 • 조회 655

이원형

라인플러스 소프트웨어 엔지니어

7월 26일

인프라 엔지니어의 교과서 개정 2판

근

저장 5 • 조회 2,287

조서희

컬리 백엔드 개발자

2023년 05월 19일

🕊️ 주니어 자바 개발자를 위한 100가지 질문 (1)

"주니어 자바 개발자를 위한 100가지 질문" 1편입니다. 주니어 자바 개발자를 위한 100가지 질문 (2) - [https://careerly.co.kr/comments/84093] 1️⃣ 기초 📌 JDK와 JRE의 차이점은 무엇입니까? 📌 ==와 equals의 차이점은 무엇입니까? 📌 두 객체가 동일한 hashCode를 가지면 Equals()가 참이어야 합니다, 그렇죠? 📌 자바에서 final의 기능은 무엇입니까? 📌 자바에서 Math.round(-1.5)는 무엇을 의미합니까? 📌 String은 기본 데이터 ... 더 보기

Top 100 Java Interview Questions for 1 to 3 Years Experienced Programmers

Medium

•

저장 1,416 • 조회 33,483

장홍석

스페이스오디티 부대표/CPO

2일 전

< 왜 우리는 좋은 일보다 나쁜 일에 집착할까? >

댓글 1 • 저장 2 • 조회 402

골빈해커

Chief Maker

6일 전

이력서 노션으로 절대 쓰지 마세요.

(다시 돌아온 노션 이력서 절기)

•

댓글 1 • 저장 9 • 조회 2,945

HoJoong Kim

Senior IT guy

1월 21일

[AI자격증] NVIDIA-Gen AI LLMs(NCA-GENL)

Generative AI and LLMs Certification

NVIDIA

저장 36 • 조회 3,112

비슷한 게시물

골빈해커 Chief Maker

📝 Anthropic의 LLM 마인드 맵핑 개념 이해하기

전영환 AI Scientist & 추천기술팀 Team Leader

Nvidia의 AI agent Eureka

소성은 Gen AI Field Solution Architect @ Google

claude 3.5 sonnet 공개

골빈해커 Chief Maker

🗞️ 구글에서 오픈소스 LLM, Gemma 공개

이명진 한국레드햇 솔루션 아키텍트

생성형 AI, 2024년 예측 TOP 10

서진호 sr. Presales Solution Architect, HPC&AI

<2024년 지켜볼 8가지 AI 이슈 (1)>

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

진짜 1인 개발자 전성시대

황경찬(Boaz) P.E.C CEO

혹시 Claude 나 cursor 등 AI 로 개발하실 때 뭔가

골빈해커 Chief Maker

이력서 노션으로 절대 쓰지 마세요.

한성규 '지금 써보러 갑니다' '팁스터 뉴스레터' 운영자

“무엇을 만들까”보다 “왜 해야 하나요?”를 묻는 사람들, 토스페

장홍석 스페이스오디티 부대표/CPO

< 모든 선택지를 검토하다 아무것도 못 하는 당신에게 >

달레 Apollo GraphQL Software Engineer

🍜 짜파게티가 왜 거기서 나와?

psmon 블룸에이아이 서버 엔지니어

액터모델을 이용 이벤트소스/클러스터상태관리를 우아하게하기 - 코틀

Arawn Park Senior Engineer & Engineering Lead

첫 회사보다 중요한 것

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

토스 데이터 직군 집중 채용 - 면접만 봐도 100만원!

우디디자인랩 대표ㅣ프로덕트 디자이너

면접에서 진심을 보여주는 마지막 질문

[230922] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

댓글 0

함께 읽은 게시물

스펙을 뛰어넘는 힘

인프라 엔지니어의 교과서 개정 2판

🕊️ 주니어 자바 개발자를 위한 100가지 질문 (1)

< 왜 우리는 좋은 일보다 나쁜 일에 집착할까? >

이력서 노션으로 절대 쓰지 마세요.

[AI자격증] NVIDIA-Gen AI LLMs(NCA-GENL)

비슷한 게시물

주간 인기 TOP 10

추천 프로필