[트렌드와칭] LLM 답변 향상을 위한 RAG이란 무엇인가?

거대언어모델(LLM, Large Language Model)과 관련한 최신 기사를 읽다보면 RAG(Retrieval Augmented Generation, 검색증강생성)이란 단어가 자주 등장한다. RAG(랙)에 대해 깔끔하게 정리한 트렌드 와칭글이 있어 옮겨봅니다. ^^


1. RAG이란 무엇인가?

  • 검색증강생성(RAG)은 자연어 처리(NLP) 작업, 특히 개방형 도메인 질문의 답변에 사용되는 접근 방식이다.

  • 검색기반모델과 생성기반모델의 강점을 결합하여 보다 정확하고 유익한 답변을 제공한다.(by Claude) 

  • RAG은 LLM의 출력을 최적화하여 응답을 생성하기 전에 LLM 외부의 신뢰할 수 있는 콘텐츠를 참조하는 방식이다.


2. RAG은 LLM의 문제를 해결하는 한 가지 접근 방식

LLM의 알려진 문제점은 다음과 같다.

  • 답변이 없을 때 허위 정보를 제공한다. (환각현상, 할루시네이션, hallusination) 

  • 이용자가 구체적이고 최신의 응답을 기대할 때 오래되었거나 일반적인 정보를 제공한다. (out of data)

  • 신뢰할 수 없는 출처로부터 응답을 생성한다. (source)

>>RAG는 LLM의 문제 중 일부를 해결하기 위한 한 가지 접근 방식이다. (참고: 아마존)


3. RAG 접근 방식의 두 가지 주요 구성 요소

1) 검색기(Retriever)

  • 검색기반(retrieval-based)모델로서 일반적으로 'dense passage retriever'나 'sparse vector space' 모델이다. 이 모델의 역할은 입력 질문을 기반으로 대규모 코퍼스(corpus, 예: Wikipedia)에서 관련 구절이나 문서를 검색하는 것이다.

2) 생성기(Generator)

  • 생성형언어(generative language)모델로서 일반적으로 버트(BERT), GPT, T5와 같이 사전 학습된 대규모 트랜스포머 모델이다. 이 모델의 역할은 입력 질문과 검색된 내용을 모두 조건화하여 최종 답변을 생성하는 것이다.


4. RAG 작동 방식

  • RAG가 없는 경우 LLM은 이용자 입력을 받아 이미 알고 있는 정보를 기반으로 응답을 생성한다.

  • RAG을 적용하면 이용자 입력을 활용하여 먼저 LLM 외부의 데이터에서 정보를 가져오는 정보검색 과정이 먼저 실행된다. 이용자 질문과 관련 정보가 합쳐져서 LLM에게 제공된다. LLM은 새로 제공되는 정보와 LLM의 학습 데이터를 활용하여 더 나은 응답을 생성한다.


5. RAG의 장점

거대언어모델(LLM)의 강력한 언어 이해와 생성 기능을 유지하면서 대규모 코퍼스의 방대한 지식을 활용하여 보다 정확하고 내용이 풍부한 답변을 제공할 수 있다는 점이다.

  • 비용 효율적인 구현

  • 최신 정보 활용

  • 이용자 신뢰 강화

  • 개발자 제어 강화


6. RAG 모델의 대표적인 예

  • 메타(구 페이스북) AI의 RAG (검색 증강 세대)

  • 구글 AI의 REALM (검색 증강 언어 모델)

  • 마이크로소프트의 FiD (퓨전 인 디코더)


RAG 모델은 많은 오픈 도메인 QA 벤치마크에서 최고의 성능을 달성했으며 고급 질문 답변 시스템, 대화형 Ai 비서, 기타 지식 집약적인 자연어처리(NLP) 서비스를 개발할 수 있는 잠재력을 가지고 있다.


>> 보다 상세한 내용과 이미지는 원문을 참고해주세요~


  • 출처 : 트렌드와칭(https://www.trendw.kr/news/articleView.html?idxno=10613)

LLM 답변 향상을 위한 RAG이란 무엇인가?

트렌드와칭

LLM 답변 향상을 위한 RAG이란 무엇인가?

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 3월 25일 오후 2:26

 • 

저장 7조회 1,941

댓글 0

    함께 읽은 게시물


    🕊️ Java의 ExecutorService 스레드 풀 정복하기

    ... 더 보기

    Java의 ExecutorService 스레드 풀 정복하기

    덕토피아

    Java의 ExecutorService 스레드 풀 정복하기

     • 

    저장 27 • 조회 3,209


    저렴하고 빠르게 좋은소프트웨어 만들기

    ... 더 보기

    WEBNORI

    wiki.webnori.com

    WEBNORI

    누구나 쉽게 이해할 수 있는 MCP 가이드

    ... 더 보기

     • 

    저장 38 • 조회 2,493


    2019년 저서 <생산성 마스터가 되는 비법(How to be a Productivity Ninja)>으로 인기를 얻은 그레이엄 올콧은 투자은행을 대상으로 연설을 했는데 “친절함이 모든 것의 원동력이 된다. 당신이 친절하면 이긴다. 그게 전부”라고 말했다. 대부분의 청중은 이에 동의했지만, 일부는 매우 강하게 반대했다.

    ... 더 보기

    성격 나빠도 일만 잘하면 된다? 친절한 직원이 성과도 좋다 - 매일경제

    매일경제

    성격 나빠도 일만 잘하면 된다? 친절한 직원이 성과도 좋다 - 매일경제

    코딩 인터뷰 중 AI를 사용해도 될까요...? 🤔

    코딩 인터뷰를 하던 중 지원자로부터 AI를 써도 되겠냐는 질문을 받았습니다. 인터넷 검색을 해도 되냐고 물어보는 지원자는 종종 만나는데, AI를 써도 되느냐는 질문은 처음 받아봐서 좀 당황스럽더군요. 어떤 용도로 AI를 사용하시려는지 물어보았고, 익숙치 않은 프

    ... 더 보기

     • 

    댓글 1 • 저장 17 • 조회 4,140