RAG 성능을 개선하는 방법

요즘 LLM으로 서비스를 개발하면서 가장 어려운점이 RAG라고 생각합니다. 분명히 들어있는 데이터인데 가져오지 못하고, 가져온다고 하더라도 제대로 답변을 생성하지 못하는 경우가 있는데요, pre-retrieval, retrieval, post-retrieval로 나누어서 최적화 할 수 있는 방안을 소개드립니다


  • Pre-Retrieval 최적화: 데이터의 질 향상, 청크 최적화 등을 포함해 외부 데이터를 준비하고 인덱싱.

  • Retrieval 최적화: 사용자 쿼리를 기반으로 관련 문서 청크를 검색하는 과정에서의 최적화 쿼리 재작성, 다중 쿼리 검색, 하이브리드 검색

  • Post-Retrieval 최적화: 검색된 데이터를 사용자 입력과 결합하여 LLM이 정확한 답변을 생성할 수 있도록 하는 단계. re-ranking, 프롬프트 압축


요즘 re-ranking이 화두인데요, 자세한 내용은 아래 블로그를 참고해주세요!


https://luv-bansal.medium.com/advance-rag-improve-rag-performance-208ffad5bb6a

Advance RAG- Improve RAG performance

Medium

Advance RAG- Improve RAG performance

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 3일 오후 3:32

댓글 0

    함께 읽은 게시물

    소프트웨어 QA - 실무 Q&A

    ... 더 보기

    코프링에서 액터모델 AI연습장

    A

    ... 더 보기

    kopring-reactive-labs/AgenticCoding at main · psmon/kopring-reactive-labs

    GitHub

    kopring-reactive-labs/AgenticCoding at main · psmon/kopring-reactive-labs


    MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

    ... 더 보기

    MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT

    요즘IT

    MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT

     • 

    저장 23 • 조회 2,222


    엔지니어의 역량을 어떻게 확인할 수 있을까?

    작년부터 후보자의 역량을 다각도로 확인할 수 있는 인터뷰 질문에 대해 많이 고민하고 있다. 단편적인 기술적인 지식만 묻는 것을 넘어, 후보자의 문제 해결 능력, 사고방식, 그리고 시스템을 설계 및 운영해 본 경험 등을 종합적으로 보고 싶었기 때문이다. 고민 끝에 다음과 같은 형태의 질문들을 여러가지 만들어보고 있다.

    ... 더 보기

     • 

    저장 14 • 조회 2,354