RAG Evaluation

  1. test set이 중요하다.

  2. Precision & Recall

  3. Document Classification


RAG evaluation은 이렇게 3가지 포인트를 집을 수 있겠다.

우선, Test set이 가장 중요하다. query에 따라 잡혀야할 chunk가 무엇인지 사전에 정의가 필요하다. 도메인이 Finance라든가 Law라든가 전문 영역이라면, 도메인 전문가의 도움이 필요하다. 일반인이 보기에 적합하다고 생각하는 것보다, 도메인 전문가가 보기에 반드시 나와야하는 것을 기준으로 정답지를 생성한다. Test Set이 RAG 퀄리티에 가장 큰 영향을 준다.

Data 저장 방법, Embedding, Query Transformation 등을 변형하며, Test를 돌리고 가장 효율적인 조합을 찾는다. 이때 효율적인 정답 set을 결정하는 지표는 Precision&Recall을 활용할 수 있다.

  • Precision: 탐색해온 Chunk 중, Test set에서 정답이라고 한 Chunk의 개수.

  • Recall: Test set에서 정답이라고 한 Chunk의 개수 중, 탐색해온 Chunk 개수


한 발짝 더 나아가보자. Document Classification(DC) 단계가 있다면, Retrieve와 DC를 나눠서 평가할 수 있다. 목적을 달리해야한다. Retrieve에서는 최대한 정답 Document를 찾는 것에 집중하고, DC에서는 정답이 아닌 것을 걸러내는 것에 목적을 둔다.


이렇게 분리해두고 봐도 쉬운 작업은 아니지만, 나름 길은 있다.


다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 6월 2일 오전 8:52

댓글 0

    함께 읽은 게시물

    어제 AI 시대의 개발자 토론회에서 내가 대 AI 시대에는 버전관리 시스템이 필요없을 수도 있다고 생각해야한다는 말을 했는데, 그정도로 파격적인 생각을 해야한다는 이야기긴했지만, 진짜 그럴까?를 다시 한 번 생각해봤다.


    우선 버전관리 시스템의 목적은 크게 다음 세 가지다.


    ... 더 보기

    어떻게 살아갈 것인가?

    ... 더 보기

    구현패턴으로 DB사용비용을 10배줄이기

    ... 더 보기

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

    GitHub

    kopring-reactive-labs/Docs/eng/08_bulkprocessor.md at main · psmon/kopring-reactive-labs

     • 

    저장 27 • 조회 2,255


    🪄 플레이모어와 함께할 동료를 찾습니다

    ... 더 보기

    플레이모어와 함께할 동료를 찾습니다 | Notion

    playmoreai on Notion

    플레이모어와 함께할 동료를 찾습니다 | Notion

     • 

    저장 7 • 조회 2,733


    🚀 [ 임원에게 통하는 데이터 분석 보고서 작성하기 ] + 책 후기

    목적이 없는 분석은 주장이 없는 글과 같은데, 독자를 설득시킬 수 없다면 실패한 보고서라고 할 수 있습니다. 🔺 보고서를 작성하기 어려운 이유가 무엇인가? - 사람들은 데이터 분석을 통해 '새로운' 인사이트를 기대하지만 - 목적과 근거가 분명한 데이터 분석을 해야 보고서 역시 그에 맞게 만들 수 있다 - 따라서 분석 자체가 뾰족한 목적을 갖고 있어야 한다 1️⃣ (분석 전) 다양한 가설을 세우자 - 가설들은 결국 뾰족한 분석의 목적을 세우는 동시에 근거로 활용 된다 - 뾰족한 가설을 세우지 못하면 분석 과정에서 길을 ... 더 보기

    만쿠소 / 성공한 창업자의 프로필로 보는 당신이 창업에 성공할 확률 | 커리어리

    커리어리

    만쿠소 / 성공한 창업자의 프로필로 보는 당신이 창업에 성공할 확률 | 커리어리

     • 

    저장 18 • 조회 1,632


    “직원들에게 월급 외에 출근할 이유를 줘야 합니다. 팀장이 좋다던가, 이 일이 날 성장시킨다던가, 이 일이 좋다던가, 이게 다 여기에 해당합니다.“ 박웅현 TBWA 코리아 조직문화연구소 소장은 직원들을 조직에 남게하는 방법을 이렇게 제안했다.

    ... 더 보기

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]

    뉴시스

    박웅현 TBWA 조직문화연구소장 "모든 직원은 고객, '회사 팬' 만들어야" [뉴시스 포럼-10년후 한국]