Cohere Rerank를 사용한 RAG 성능 향상 | Amazon Web Services
Amazon Web Services
RAG를 활용하면 AI 애플리케이션이 외부의 신뢰할 수 있는 도메인별 데이터를 효과적으로 사용하여 사용자 쿼리에 대한 언어 모델의 문맥을 강화할 수 있습니다. 하지만, 응답의 신뢰성과 정확도는 적절한 도메인 데이터를 찾는 것에 크게 의존합니다. 따라서, RAG의 검색 프로세스를 최적화하는 것이 생성된 응답의 신뢰성을 높이는 핵심 요소로 작용합니다.
RAG 오케스트레이션에는 일반적으로 관련 문서 검색과 답변 생성이라는 두 단계가 포함됩니다.
검색 단계 – RAG는 생성된 검색 쿼리를 활용하여 외부 데이터 소스에서 관련된 문서들을 가져옵니다. 검색 쿼리가 주어지면, RAG 기반 애플리케이션은 데이터 소스에서 관련 문서나 구절을 탐색하여 필요한 정보를 수집합니다.
근거 기반 생성 단계 – 검색된 문서나 구절을 바탕으로 생성 모델은 신뢰할 수 있는 자료를 활용하여 답변을 생성하며, 필요한 경우 인라인 인용을 포함하여 답변의 신뢰성을 높입니다. 이를 통해 보다 높은 신뢰성 있는 응답을 제공할 수 있습니다.
RAG 시스템은 검색 및 정보 탐색 시스템 구축에 중요한 도구이지만, 종종 검색 단계가 최적화되지 않아 기대에 미치지 못하는 경우가 발생할 수 있습니다. 이를 보완하기 위해 순위를 재 조정하는 Rerank 단계를 추가해 검색 품질을 개선할 수 있습니다.
Cohere Rerank로 검색 정확도 높이기
정확도 문제를 해결하기 위해 검색 엔지니어들은 검색 품질을 높이기 위한 방법으로 2단계 검색 방식을 채택해 왔습니다. 이 2단계 시스템에서는 1단계 모델(임베딩 모델 또는 리트리버)이 대규모 데이터 세트에서 후보 문서들을 먼저 검색한 후, 2단계 모델(리랭커)이 이를 재정렬하여 가장 관련성이 높은 문서들이 상위에 표시되도록 합니다.
예를 들어, Cohere Rerank와 같은 재랭크 모델은 쿼리와 문서 쌍이 주어졌을 때 각 쌍에 대한 유사성 점수를 출력합니다. 이 점수는 검색 쿼리와의 관련성을 바탕으로 문서 순위를 재정렬하는 데 사용됩니다. 특히 Cohere Rerank 모델은 딥 러닝을 통해 쿼리와 문서 간의 정밀한 일치를 평가하여, 기존 임베딩 모델보다 검색 정확도를 크게 향상시키는 점에서 두드러집니다. Cohere Rerank는 쿼리와 문서를 동시에 처리하여 관련성 점수를 산출함으로써 더 정교한 문서 선택이 가능합니다.
https://aws.amazon.com/ko/blogs/tech/improve-rag-performance-using-cohere-rerank/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 12월 16일 오후 1:29