Community

<새 메타의 논문, LIMA에 대하여>

커리어리 친구들, 요즘 하루가 멀다하고 인공지능 분야에 새로운 논문과 서비스가 나오고 있습니다. 오늘은 메타의 새로운 논문이자 모델인 LIMA에 대해 짧게 요약하고자 합니다. 🌸 강화학습 이나 선호도 모델링 없이 잘 큐레이트된 1000개의 프롬프트만으로 파인튜닝한 LLaMA 모델 🌸 43% 사례에서 GPT-4와 동등하거나 더 선호, Bard와 비교했을 때 58%, 휴먼 피드백으로 훈련한 DaVinci003에 비해 65% 높음 🌸 논문의 가설은 LLM의 거의 모든 지식은 Pretraining중에 학습되는 것이며, Alignment는 사용자와 상호작용하는 포맷/스타일을 학습하는 간단한 프로세스 라는 것 🌸 650억개 파라미터를 가진 LLaMA 모델과 천 개의 프로폼트로 GPT-4 성능에 근접함

알림

알림이 없습니다