김성혁

테크 리드

[231016] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다.

1️⃣[Prometheus: 오픈 소스 언어 모델로서의 장문 응답 평가 및 개선 모델]

대형 언어 모델(GPT-4 같은)을 사용하는 것이 장문 응답 평가의 표준이 되었지만, 이러한 독점 모델에는 한계가 있습니다. 이 연구는 완전 오픈 소스 언어 모델인 Prometheus를 소개하며, 이는 적절한 참고 자료와 함께 제공될 때 GPT-4와 유사한 평가 능력을 가집니다. 새로운 데이터 세트인 피드백 컬렉션을 사용하여 Prometheus를 훈련하였고, 그 결과 Prometheus는 인간 평가자와 높은 상관관계를 보였으며, 다양한 벤치마크에서도 우수한 성능을 발휘했습니다. 이 연구는 Prometheus가 효과적인 평가자 언어 모델로서의 역량을 보여줍니다.

https://huggingface.co/papers/2310.08491

2️⃣[KQG-CoT: 연쇄적 사고 기반의 지식 기반 질문 생성 방법]

지식 기반 질문 생성(KBQG)은 논리적 형태를 자연어 질문으로 변환하는 작업입니다. 현재의 접근법은 주석이 달린 데이터에 많이 의존하며, 이는 리소스가 부족한 상황에는 적합하지 않습니다. 이 연구에서는 연쇄적 사고(CoT) 프롬프트에 기반한 새로운 프롬프트 방식, KQG-CoT를 제안합니다. 이 방식은 논리 형식을 기반으로 지원 논리 형식을 검색하고, 그를 기반으로 질문 생성 추론 사슬을 정의하는 프롬프트를 작성합니다. KQG-CoT+ 확장을 통해 프롬프트의 품질이 향상되었습니다. 실험 결과, 이 방식은 다른 프롬프트 기준선보다 우수한 성능을 보였으며, 특히 PathQuestions 데이터 세트에서 기존의 최고 성능을 능가하였습니다.

https://arxiv.org/abs/2310.08395

3️⃣[LangNav: 언어 기반 내비게이션을 위한 지각적 표현 활용 방법]

논문은 시각과 언어 탐색을 위한 지각적 표현으로 언어를 활용하는 방법을 연구합니다. 이 방법은 기존 비전 시스템을 통해 에이전트의 시각을 자연어 설명으로 변환하고, 사전 학습된 언어 모델을 미세 조정하여 내비게이션 지침을 제공합니다. 기존의 시각적 특징을 사용하는 대신, 이 연구는 언어를 지각 표현으로 활용합니다. R2R 비전 및 언어 내비게이션 벤치마크에서의 실험은 언어 기반 내비게이션(LangNav)의 능력을 확인하며, 몇 개의 골드 궤적만 사용하여도 강력한 기준선을 뛰어넘을 수 있음을 보여줍니다.

https://huggingface.co/papers/2310.07889

—

🥇K-디지털 트레이닝 기관 최초! '대통령 표창' 수상한 모두의연구소의 신뢰받는 교육

☑️ AI 딥러닝을 심도 있게! <AI학교 아이펠> 7기 지원하기 → https://bit.ly/3YDkLV4

☑️ SW 과정 신규 오픈! <자바스크립트 웹 풀스택> 1기 지원하기 → https://bit.ly/3tmITjj

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 10월 15일 오후 11:41

저장 1 • 조회 945

함께 읽은 게시물

𝙍𝙞𝙘𝙝𝙖𝙧𝙙

처음 배워도 재미있고 가치있는 DATA/AI 교육을 만듭니다.

2일 전

엔지니어링의 핵심, 유지 보수가 가능한 파이프라인 구성하기

오

모던 데이터 파이프라인 구축기: 레거시를 넘어

Medium

저장 4 • 조회 1,302

김하림

우아한형제들 프론트엔드 개발자

6일 전

Rolldown-Vite 출시

Announcing Rolldown-Vite

void(0)

저장 3 • 조회 1,311

달레

Apollo GraphQL Software Engineer

2일 전

🧊 급격하게 얼어붙고 있는 해외 취업 시장 🥶

최근 한국에 아는 개발자 분께서 미국에서 근무할 수 있는 포지션의 최종 면접을 앞두고 있었는데 갑자기 채용이 무기한 연기되었다는 황당한 소식을 듣게 되셨습니다. 다른 개발자 분께서는 심지어 최종 합격을 하고 리로케이션 패키지까지 받았는데, 느닷없이 오퍼가 취

저장 1 • 조회 1,429

김의중

프론트엔드 개발자

1월 1일

동적 Polyfill 서비스로 실현하는 토스의 브라우저 호환성

프

똑똑하게 브라우저 Polyfill 관리하기

toss.tech

저장 15 • 조회 2,646

한기용

UpZen 창업자 대표 & 산호세 주립대 교수

2일 전

Airflow 3.0 주요 기능 소개

지

댓글 1 • 저장 9 • 조회 1,655

김의중

프론트엔드 개발자

2월 27일

아임웹 테크 밋업: 기술의 장벽을 허무는 사람들

아

아임웹의 첫 번째 테크밋업 [WIP 2025 : 기술의 장벽을 허무는 사람들] 에 초대합니다. : imweb Team l 아임웹 채용

team.imweb.me

저장 6 • 조회 2,010

비슷한 게시물

김성혁 테크 리드

[231019] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

김성혁 테크 리드

[231023] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

김성혁 테크 리드

[231018] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

김성혁 테크 리드

[240405] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

김성혁 테크 리드

[231017] 모두의연구소가 전하는 “모두를 위한 SW/AI 뉴스”

김성혁 테크 리드

[231109] 모두의연구소/오름캠프가 전하는 “모두를 위한 SW/AI

주간 인기 TOP 10

골빈해커 Chief Maker

[광고] 다음 직무 채용 예정입니다. - 프러덕트/사업 기획 1

김의중 프론트엔드 개발자

Next.js 프로젝트를 AWS EKS에 배포하며 배운 것들

달레 Apollo GraphQL Software Engineer

🌎 해외에서 일하면 뭐가 좋을까요❓

K리그 프로그래머 커피한잔 개발자

앱 개발 개척시대

psmon 웹노리라이터

서버엔지니어의 시대적 고민

장홍석 스페이스오디티 부대표/CPO

< 서비스를 중독성 있게 만드는 결정적 원리 >

레드버스백맨 리서처 앤 라이터

⟪UX 디자이너가 사라지고 있다⟫

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

하나부터 열까지 리더가 상세히 설명해 주기를 바라는 구성원이 있습

평비 LGCNS 백엔드 개발자

개발자 교양 팟캐스트

조찬우 Coupang Sr. iOS Engineer

iOS 19가 아니라 이제 iOS 26?

[231016] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

댓글 0

함께 읽은 게시물

엔지니어링의 핵심, 유지 보수가 가능한 파이프라인 구성하기

Rolldown-Vite 출시

🧊 급격하게 얼어붙고 있는 해외 취업 시장 🥶

동적 Polyfill 서비스로 실현하는 토스의 브라우저 호환성

Airflow 3.0 주요 기능 소개

아임웹 테크 밋업: 기술의 장벽을 허무는 사람들

비슷한 게시물

주간 인기 TOP 10

추천 프로필