Kimjeongeun

모두의연구소 아이펠캠퍼스 퍼실리테이터

[0814]모두에게 전하는 모두연 AI뉴스!

LongWriter: 장문 출력을 위한 LLM 개선과 LongWriter-6k 데이터 세트 및 LongBench-Write 벤치마크 개발

현재의 장문맥 대규모 언어 모델(LLM)은 최대 100,000개의 토큰을 처리할 수 있지만, 2,000단어를 초과하는 출력을 생성하는 데 어려움을 겪고 있습니다. 이는 감독 미세 조정(SFT) 중에 긴 출력 예시가 부족하기 때문입니다. 이 문제를 해결하기 위해, 에이전트 기반 파이프라인인 AgentWrite를 도입하여 모델이 20,000단어 이상의 일관된 출력을 생성할 수 있도록 했습니다. 이를 통해 2천 단어에서 32천 단어까지의 데이터를 포함한 LongWriter-6k 데이터 세트를 구축하고, 이를 사용해 기존 모델의 출력 길이를 10,000단어 이상으로 확장하는 데 성공했습니다. 또한, LongBench-Write라는 벤치마크를 개발하여, 개선된 모델이 초장문 생성에서 뛰어난 성능을 발휘함을 입증했습니다.

https://huggingface.co/papers/2408.07055

OpenResearcher: AI 기반 플랫폼을 통한 연구 동향 파악 및 도메인 별 지식 제공

OpenResearcher는 연구자들이 최신 연구 동향을 파악하고 새로운 분야를 탐구하는 데 도움을 주기 위해 인공지능(AI) 기술을 활용한 혁신적인 플랫폼입니다. 이 플랫폼은 검색 증강 생성(RAG)을 기반으로 대규모 언어 모델(LLM)과 최신 도메인별 지식을 통합하여, 연구자의 쿼리를 이해하고 과학 문헌을 검색하며, 필터링된 정확하고 포괄적인 답변을 제공합니다. 또한, 답변을 자체 수정할 수 있는 다양한 도구를 개발하여 효율성과 효과성을 높입니다. OpenResearcher는 연구자들이 시간을 절약하고 새로운 인사이트를 발견하며, 과학적 혁신을 촉진할 수 있도록 지원합니다.

https://huggingface.co/papers/2408.06941

사전 신청 후 과정 입학하면 데이터 분야 참고 서적 증정! 데이터사이언티스트 과정 지원하기 : https://bit.ly/3YBFXNf

Paper page - LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs

huggingface.co

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 8월 14일 오전 6:00

함께 읽은 게시물

골빈해커

Chief Maker

7월 28일

앞으로의 코테는 설명을 주고 코드를 짜라고 하는 것이 아니라, 코드를 주고 설명을 하라는 것이 유효할 것이다.

내 경우는 이미 그렇게 하고 있는데, 요구사항을 주고 개발을 요청. 결과물이 요구사항대로 개발이 잘 되었다면, 다음 단계로 제출한 코드를 리뷰하며 설명을 요청한다.

•

댓글 2 • 저장 21 • 조회 3,545

장홍석

스페이스오디티 부대표/CPO

하루 전

< 보여서 걷는 게 아니라, 걷다 보니 길 >

댓글 1 • 저장 4 • 조회 644

골빈해커

Chief Maker

2일 전

나는 종종 생산성을 올리기 위한 각종 개발 툴은 물론, 라이브러리나 소스 코드를 구매하기도 한다.

소스 코드의 경우 실제로 써먹지 못하는 경우도 상당수 되긴 하지만, 그래도 구성이나 코드를 보면서 배우는게 있기 때문에 학습 비용이라고 생각하고 가끔 구매하는 편이다.

저장 3 • 조회 1,528

데이터리안

Data Analyst

하루 전

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

데

- YouTube

www.youtube.com

저장 4 • 조회 534

비슷한 게시물

이양일 NaverCloud 백엔드 개발자

🤖 10분 만에 RAG 이해하기

Kimjeongeun 모두의연구소 아이펠캠퍼스 퍼실리테이터

[0927]모두에게 전하는 모두연 AI뉴스!

HoJoong Kim Senior IT guy

[Dev.to] LLM 성능 향상을 위한 5가지 기법

HoJoong Kim Senior IT guy

[LLM Watch] 스스로 발전하고 있는 LLMs

백선환 AWS/ AIML Specialist

RAG 평가 메커니즘을 설계하는 새로운 방법

골빈해커 Chief Maker

📝 LLM 할루시네이션을 10배 감소 시키는 메모리 튜닝

주간 인기 TOP 10

골빈해커 Chief Maker

오늘의 탐라는 “ChatGPT 쓰셨던데 그러고도 개발자입니까?”

김의중 프론트엔드 개발자

Claude Code 실전 가이드: AI 네이티브 개발자로 가는

Arawn Park Senior Engineer & Engineering Lead

넷플릭스는 왜 WebFlux를 사용하지 않을까?

psmon 블룸에이아이 서버 엔지니어

카프카를 우아하게 사용하기 -코틀린편

달레 Apollo GraphQL Software Engineer

알아 알아 알아! 🤣

장홍석 스페이스오디티 부대표/CPO

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

황경찬(Boaz) P.E.C CEO

"AI가 코드를 짜는 시대, 개발자의 가치는 무엇일까요?" 최근

정종윤 네이버 프론트엔드 개발자

👻 클라이언트에서 안전한 소셜 로그인 구현을 위한 OIDC와 PK

박승규 카카오계열사에서 이것저것 만드는 개발자

책이 출판되기 전 마지막 교정을 하고 있는데... GPT5가 출시

석민 커리어 코치

백엔드 개발자 이력서 고민

[0814]모두에게 전하는 모두연 AI뉴스!

댓글 0

함께 읽은 게시물

< 보여서 걷는 게 아니라, 걷다 보니 길 >

데이터 분석가 600명의 이직 결심 사유는 무엇일까요?

비슷한 게시물

주간 인기 TOP 10

추천 프로필