[231016] 모두의연구소가 전하는 “모두를 위한 AI 뉴스”

모두의연구소는 함께 공유하고 성장하는 국내 최대 AI 커뮤니티입니다. 


1️⃣[Prometheus: 오픈 소스 언어 모델로서의 장문 응답 평가 및 개선 모델]


대형 언어 모델(GPT-4 같은)을 사용하는 것이 장문 응답 평가의 표준이 되었지만, 이러한 독점 모델에는 한계가 있습니다. 이 연구는 완전 오픈 소스 언어 모델인 Prometheus를 소개하며, 이는 적절한 참고 자료와 함께 제공될 때 GPT-4와 유사한 평가 능력을 가집니다. 새로운 데이터 세트인 피드백 컬렉션을 사용하여 Prometheus를 훈련하였고, 그 결과 Prometheus는 인간 평가자와 높은 상관관계를 보였으며, 다양한 벤치마크에서도 우수한 성능을 발휘했습니다. 이 연구는 Prometheus가 효과적인 평가자 언어 모델로서의 역량을 보여줍니다.

https://huggingface.co/papers/2310.08491


2️⃣[KQG-CoT: 연쇄적 사고 기반의 지식 기반 질문 생성 방법]


지식 기반 질문 생성(KBQG)은 논리적 형태를 자연어 질문으로 변환하는 작업입니다. 현재의 접근법은 주석이 달린 데이터에 많이 의존하며, 이는 리소스가 부족한 상황에는 적합하지 않습니다. 이 연구에서는 연쇄적 사고(CoT) 프롬프트에 기반한 새로운 프롬프트 방식, KQG-CoT를 제안합니다. 이 방식은 논리 형식을 기반으로 지원 논리 형식을 검색하고, 그를 기반으로 질문 생성 추론 사슬을 정의하는 프롬프트를 작성합니다. KQG-CoT+ 확장을 통해 프롬프트의 품질이 향상되었습니다. 실험 결과, 이 방식은 다른 프롬프트 기준선보다 우수한 성능을 보였으며, 특히 PathQuestions 데이터 세트에서 기존의 최고 성능을 능가하였습니다.

https://arxiv.org/abs/2310.08395


3️⃣[LangNav: 언어 기반 내비게이션을 위한 지각적 표현 활용 방법]


논문은 시각과 언어 탐색을 위한 지각적 표현으로 언어를 활용하는 방법을 연구합니다. 이 방법은 기존 비전 시스템을 통해 에이전트의 시각을 자연어 설명으로 변환하고, 사전 학습된 언어 모델을 미세 조정하여 내비게이션 지침을 제공합니다. 기존의 시각적 특징을 사용하는 대신, 이 연구는 언어를 지각 표현으로 활용합니다. R2R 비전 및 언어 내비게이션 벤치마크에서의 실험은 언어 기반 내비게이션(LangNav)의 능력을 확인하며, 몇 개의 골드 궤적만 사용하여도 강력한 기준선을 뛰어넘을 수 있음을 보여줍니다.

https://huggingface.co/papers/2310.07889



🥇K-디지털 트레이닝 기관 최초! '대통령 표창' 수상한 모두의연구소의 신뢰받는 교육

☑️ AI 딥러닝을 심도 있게! <AI학교 아이펠> 7기 지원하기 → https://bit.ly/3YDkLV4

☑️ SW 과정 신규 오픈! <자바스크립트 웹 풀스택> 1기 지원하기 → https://bit.ly/3tmITjj

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2023년 10월 15일 오후 11:41

댓글 0

    함께 읽은 게시물

    엔지니어링의 핵심, 유지 보수가 가능한 파이프라인 구성하기

    ... 더 보기

    모던 데이터 파이프라인 구축기: 레거시를 넘어

    Medium

    모던 데이터 파이프라인 구축기: 레거시를 넘어


    🧊 급격하게 얼어붙고 있는 해외 취업 시장 🥶

    최근 한국에 아는 개발자 분께서 미국에서 근무할 수 있는 포지션의 최종 면접을 앞두고 있었는데 갑자기 채용이 무기한 연기되었다는 황당한 소식을 듣게 되셨습니다. 다른 개발자 분께서는 심지어 최종 합격을 하고 리로케이션 패키지까지 받았는데, 느닷없이 오퍼가 취

    ... 더 보기

    동적 Polyfill 서비스로 실현하는 토스의 브라우저 호환성

    ... 더 보기

    똑똑하게 브라우저 Polyfill 관리하기

    toss.tech

    똑똑하게 브라우저 Polyfill 관리하기

    Airflow 3.0 주요 기능 소개

    ... 더 보기