Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
arXiv.org
🔥 RAG (Retrieval-Augmented Generation) 한줄정리 :
LLM 나는 너가 혼자 지어내는 말은 못 믿겠으니까, 내가 정해준 이 범위 안에서 검색해줄테니 그거 요약해서 답변 만들어줘.
✒️ 비유로 이해해보는 RAG
대학교 시험 중 하나의 간단한 질문에 대해 2페이지 짜리 에세이를 써야하는 논술형 시험들이 있습니다. 제 기억 속 어떤 시험에서는, 교수님이 뚜벅뚜벅 걸어 들어오셔서 칠판에 "우리는 법과 도덕 중 무엇에 지배받는가?" 라는 질문을 쓰시고 80분 타이머를 시작하셨습니다.
만약, 여기서 제가 수업을 대충만 들었다면, 교수님이 기대하시는 논어와 현대 서양 철학의 레퍼런스들은 없이 혼자 주저리주저리 이야기를 했겠죠. 답변을 할 수는 있는 질문이니까요.
"어릴 적 무단횡단을 했을 때, 도덕적으로 찔렸지만..." 이런 이야기는 아무리 길고 2페이지 가득 채워도 학점을 주기 어려웠을 것입니다.
LLM도 비슷하죠. 마구마구 이야기를 만들어낼 수 있지만 우리가 과연 그것을 어디까지 신뢰할 수 있을까요? 그 답변을 서비스에 안정적으로 사용할 수 있을까요?
👍 RAG의 목표
RAG의 목표는 확실한 근거가 있는 답변을 근거와 함께 제공함으로써 통해 모델의 정확성과 신뢰성을 향상시키는 것입니다.
특히나 이 시스템은 지식 집약적인 작업에서 유리하며, 더 나아가 지속적인 지식 업데이트도 가능하며 분야별 정보들을 통합해서 활용할 수 있다는 장점이 있습니다.
🤖 RAG 방법론
이전에는 LLM에 사용자의 질문을 바로 전달했지만, RAG 시스템에서는 다른 방식을 사용합니다. 먼저 상단의 검색 엔진에 질문을 보내어 신뢰성 있는 답변을 찾습니다. 그런 다음, LLM에게 해당 답변을 바탕으로 더욱 정확하고 유용한 정보를 생성하도록 요청합니다. 이렇게 함으로써 RAG 시스템은 LLM만 사용하는 방식보다 더 나은 결과를 얻을 수 있습니다.
👉 더욱 자세한 내용이 궁금하시다면 기초 논문인 "RAG for Knowledge-Intensive NLP Tasks" 논문을 참고해주세요.
https://arxiv.org/abs/2005.11401
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 1월 24일 오전 3:47
제가 리드하고 있는 조직(당근마켓 커뮤니티실)에서 백엔드 엔지니어를 채용 중이에요.
커뮤니티실에는 동네 이웃들의 이야기와 정보를 공유하는 동네생활팀, 이웃 간의 취미와 관심사를 연결하는 모임팀, 그리고 아파트 단지 생활을 더 편리하고 즐겁게 만들어 줄 단지팀이 있어요. 지금 내 동네에서 일어나고 있는 일들을 더 쉽게 즐기고 공유할 방법들을 찾는 일이라면 무엇이든 도전하여 실행에 옮겨요. 만드는 사람이 불편할수록 쓰는 사람은 편하다는 믿음으로 도전적인 문제를 풀어나갈 분과 함께하고자 해요.
... 더 보기태초에 모든 동물은 바다에서 살았다. 바다가 동물이 살기 좋은 환경이었던 것이다. 그런데, 동물 사이에 먹이 사슬이 형성되었고, 힘이 없는 동물들은 척박한 곳으로 밀려났다. 그곳이 바로 강이다. 처음에는 강에서 살기 힘들었지만, 성공적으로 적응하는 동물들이 생겨났고, 그래서 강에도 생태계가 형성되었다.
... 더 보기