Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
arXiv.org
🔥 RAG (Retrieval-Augmented Generation) 한줄정리 :
LLM 나는 너가 혼자 지어내는 말은 못 믿겠으니까, 내가 정해준 이 범위 안에서 검색해줄테니 그거 요약해서 답변 만들어줘.
✒️ 비유로 이해해보는 RAG
대학교 시험 중 하나의 간단한 질문에 대해 2페이지 짜리 에세이를 써야하는 논술형 시험들이 있습니다. 제 기억 속 어떤 시험에서는, 교수님이 뚜벅뚜벅 걸어 들어오셔서 칠판에 "우리는 법과 도덕 중 무엇에 지배받는가?" 라는 질문을 쓰시고 80분 타이머를 시작하셨습니다.
만약, 여기서 제가 수업을 대충만 들었다면, 교수님이 기대하시는 논어와 현대 서양 철학의 레퍼런스들은 없이 혼자 주저리주저리 이야기를 했겠죠. 답변을 할 수는 있는 질문이니까요.
"어릴 적 무단횡단을 했을 때, 도덕적으로 찔렸지만..." 이런 이야기는 아무리 길고 2페이지 가득 채워도 학점을 주기 어려웠을 것입니다.
LLM도 비슷하죠. 마구마구 이야기를 만들어낼 수 있지만 우리가 과연 그것을 어디까지 신뢰할 수 있을까요? 그 답변을 서비스에 안정적으로 사용할 수 있을까요?
👍 RAG의 목표
RAG의 목표는 확실한 근거가 있는 답변을 근거와 함께 제공함으로써 통해 모델의 정확성과 신뢰성을 향상시키는 것입니다.
특히나 이 시스템은 지식 집약적인 작업에서 유리하며, 더 나아가 지속적인 지식 업데이트도 가능하며 분야별 정보들을 통합해서 활용할 수 있다는 장점이 있습니다.
🤖 RAG 방법론
이전에는 LLM에 사용자의 질문을 바로 전달했지만, RAG 시스템에서는 다른 방식을 사용합니다. 먼저 상단의 검색 엔진에 질문을 보내어 신뢰성 있는 답변을 찾습니다. 그런 다음, LLM에게 해당 답변을 바탕으로 더욱 정확하고 유용한 정보를 생성하도록 요청합니다. 이렇게 함으로써 RAG 시스템은 LLM만 사용하는 방식보다 더 나은 결과를 얻을 수 있습니다.
👉 더욱 자세한 내용이 궁금하시다면 기초 논문인 "RAG for Knowledge-Intensive NLP Tasks" 논문을 참고해주세요.
https://arxiv.org/abs/2005.11401
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 1월 24일 오전 3:47
그러고보니, 예전에는 입사 지원서에 희망연봉란이 있었는데 언젠가부터 사라졌네요. 왜 없어진걸까요? 제일 중요한건데…
채용과정은 지원자나 회사입장에서나 엄청난 시간과 노력이 드는거라, 합격했는데 연봉 수준이 안맞아서 취소되면 그 앞의 노력이 얼마나 허무한디…