<새 메타의 논문, LIMA에 대하여>

커리어리 친구들, 요즘 하루가 멀다하고 인공지능 분야에 새로운 논문과 서비스가 나오고 있습니다. 오늘은 메타의 새로운 논문이자 모델인 LIMA에 대해 짧게 요약하고자 합니다. 🌸 강화학습 이나 선호도 모델링 없이 잘 큐레이트된 1000개의 프롬프트만으로 파인튜닝한 LLaMA 모델 🌸 43% 사례에서 GPT-4와 동등하거나 더 선호, Bard와 비교했을 때 58%, 휴먼 피드백으로 훈련한 DaVinci003에 비해 65% 높음 🌸 논문의 가설은 LLM의 거의 모든 지식은 Pretraining중에 학습되는 것이며, Alignment는 사용자와 상호작용하는 포맷/스타일을 학습하는 간단한 프로세스 라는 것 🌸 650억개 파라미터를 가진 LLaMA 모델과 천 개의 프로폼트로 GPT-4 성능에 근접함

LIMA: Less Is More for Alignment

arXiv.org

LIMA: Less Is More for Alignment

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2023년 5월 31일 오전 1:15

 • 

저장 19조회 2,778

댓글 0

    함께 읽은 게시물

    내가 가본 우리나라 - 지도 색칠 사이트

    ... 더 보기

    10억 개 데이터로 밝혀낸 K-POP 팬덤의 모든 것 -케이팝레이더2.0

    1

    ... 더 보기

    📢 케이팝레이더 2.0이 런칭되었습니다.

    stibee.com

    📢 케이팝레이더 2.0이 런칭되었습니다.

    데이터 엔지니어로 성장하고 싶다면~

    🍀 데이터 엔지니어란? 소프트웨어 엔지니어링과 프로그래밍의 업무 역량 사이의 간극을 메우는 전문가로 데이터 엔지니어는 고급 분석 기술, 강력한 프로그래밍 기술, 통계적 지식, 빅데이터 기술에 대한 명확한 이해를 갖춘 사람입니다. 🍀 데이터 엔지니어는 어떤 일을 하나요? 정형 및 비정형 데이터에 쉽게 액세스할 수 있는 데이터 인프라를 설계, 관리, 테스트, 유지, 저장하고 작업을 하며, 대규모 데이터 처리를 탐색하고 확장 가능하고 안정적인 작업 환경을 보장하기 위해 전문 지식과 소프트 스킬 필요 🔱 서버와 애플... 더 보기

    15+ Must Have Data Engineer Skills in 2023

    Knowledgehut

    15+ Must Have Data Engineer Skills in 2023

    잘못된 개발자 면접 준비 방법 피하기 (+ 준비 자료)

    개발자 면접 자료 준비를 어디서부터 어떻게 해야 할지 모르겠나요? 또는 유명한 자료를 읽어도 도움 되지 않은 경우가 있으셨나요?

    ... 더 보기

     • 

    댓글 6 • 저장 965 • 조회 27,033


    신뢰에 대한 단상

    출근길에 읽던 글에서 신뢰에 대한 언급이 있었다. 그리고 문득, 얼마 전 구성원들과 대화하며 나도 모르게 "저를 믿고 한번 따라와 주세요"라고 말했던 순간이 떠올랐다. 글의 한 구절이 유독 마음에 깊이 파고들었다.

    ... 더 보기

    신입 개발자를 위한 조언 10가지

    

    ... 더 보기