📝 RAG vs Long-Context LLM, 승자는?

요즘 LLM의 발전 방향을 보면 크게 두가지 흐름이 있는 것 같습니다.


  1. RAG (Retrieve and Generate)를 통해 외부 지식을 사용하거나,

  2. Long-Context (LC) LLM을 학습하여 모델이 한번에 처리 가능한 입력 토큰 수를 키우는 것


RAG는 작은 모델로도 많은 지식을 다룰 수 있고, 추가 학습 없이도 최신 정보를 전달할 수 있다는 장점이 있기 때문에 Perplexity AI, Claude 등 대부분의 LLM 기반 검색 서비스에서 사용하고 있고, 이러한 기술을 뒷받침하기 위해 새로 출시하는 LLM도 대부분 긴 컨텍스트를 처리할 수 있도록 학습되고 있죠.


GPT-4 Turbo 모델이나 최근에 업데이트된 Llama 3.1 모델들 모두 128K 토큰을 처리할 수 있고, Gemini 1.5 Pro 모델은 무려 2M 토큰을 처리할 수 있다고 합니다.


🤔 그렇다면 RAG와 LC 중 어떤 방법이 더 효과적일까요? 이 질문에 대답하기 위해 구글 딥마인드 연구진은 다양한 실험을 통해 LC가 여러 벤치마크에서 전반적으로 더 좋은 성능을 보인다는 결론을 얻었습니다. 반면, RAG는 훨씬 적은 비용으로도 LC에 준하는 성능을 얻을 수 있다는 장점이 있고요. 여기서 더 나아가 저자는 답변 품질은 유지하면서 비용을 낮출 수 있는 하이브리드 방법론인 Self-Route를 제시합니다.


🔗

Retrieval Augmented Generation or Long-Context LLMs? A Comprehensive Study and Hybrid Approach

Google DeepMind University of Michigan

https://arxiv.org/pdf/2407.16833


다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 8월 5일 오전 6:27

 • 

저장 14조회 1,516

댓글 0

    함께 읽은 게시물

    탈락 분석

    

    ... 더 보기

     • 

    저장 4 • 조회 924


    데이터의 가치는 어떻게 평가할 수 있을까?'

    산업은행은 2020년 한국신용데이터에 50억 원 지원을 시작으로 기업의 데이터를 담보로 한 대출을 제공하고 있다. 관련 보도자료에 따르면 출시 후 1년 동안 쏘카, 직방 등 양질의 데이터를 가진 기업들을 대상으로 누적금액 약 1,000억 원의 대출을 실행했다고 한다. 특정 자산을 담보로 대출을 제공하기 위해서 무엇보다 가장 중요한 일은 그 자산의 가치를 정확하게 평가하는 것이다. 그렇다면 데이터의 가치는 어떻게 평가할 수 있을까? 전통적으로 자산의 가치는 '수익', '시장', '원가' 세 가지 관점에서 평가할 수 있고, 데이터 또한 기업의 무형자산 중 하나로서 세 관점에서 그 가치를 평가해 볼 수 있다. 첫째로 수익 관점에서의 데이터의 가치는 데이터를 사용하여 발생하는 미래의 순수익을 현재가치로 환산하여 그 총합을 합 한 것이다. 예를 들어 은행이 통신 데이터를 신용평가에 활용하여 부도나 연체로 인한 손실을 줄일 수 있다면, 그만큼의 금액에서 데이터를 사용하는데 필요한 비용을 차감한 후 기간별 할인계수를 적용하여 그 합을 구할 수 있다. 둘째로 시장 관점에서는 평가 대상의 데이터와 유사한 데이터가 과거에 ... 더 보기

    얼마전에 신입 개발자 채용시 과제를 10분 내에 빠르게 만들어서 보낸 사람을 채용했다며, 빠르게 결과를 냈기 때문에 채용했다는 글이 SNS에 많이 돌았다. 그러면서 이렇게 말한다.


    "알고리즘 많이 푸는 개발자보다, AI로 빠르게 결과 내는 사람을 선호. 알고리즘, 코딩 책 안 봐도 AI 도구만 적극 활용하면 취업 기회 잡을 수 있다."


    ... 더 보기

     • 

    저장 12 • 조회 2,071


    데이터 사이언티스트가 되는 방법

    S

    ... 더 보기