PDF 내 이미지&표를 참고하여 답변하는 멀티모달 RAG(GPT-4o)
GPT-4o 출시 기념으로 "PDF" 문서내 이미지와 표를 참고하여 답변하는 #멀티모달RAG 를 구현했습니다. 링크: https://youtu.be/U_f4-Br3_Y0?si=mchn1HXqH19GvxEF [요약] - PDF 문서에 이미지, 표, 텍스트를 별도 추출 - 표, 이미지에 대한 요약 생성 - Query 에 대하여 유사도 계산 후 만약 image 요약본에 대한 검색이 상위결과라면 Image 를 GPT-4o 에 관련 텍스트와 함께 입력으로 넣어주고, 답변을 받습니다. 영상에서 사용한 PDF 예시는 Financial Report 입니다. 감사합니다! 즐거운 토요일 저녁 되세요! #multimodal #gpt4o #rag