PDF 내 이미지&표를 참고하여 답변하는 멀티모달 RAG(GPT-4o)

GPT-4o 출시 기념으로 "PDF" 문서내 이미지와 표를 참고하여 답변하는 #멀티모달RAG 를 구현했습니다.

링크: https://youtu.be/U_f4-Br3_Y0?si=mchn1HXqH19GvxEF

[요약]

- PDF 문서에 이미지, 표, 텍스트를 별도 추출

- 표, 이미지에 대한 요약 생성

- Query 에 대하여 유사도 계산 후 만약 image 요약본에 대한 검색이 상위결과라면 Image 를 GPT-4o 에 관련 텍스트와 함께 입력으로 넣어주고, 답변을 받습니다.

영상에서 사용한 PDF 예시는 Financial Report 입니다.


감사합니다! 즐거운 토요일 저녁 되세요!

#multimodal #gpt4o #rag

#GPT4o 를 사용하여 PDF 내 표와 이미지를 참고하여 답변하는 #멀티모달 RAG

www.youtube.com

#GPT4o 를 사용하여 PDF 내 표와 이미지를 참고하여 답변하는 #멀티모달 RAG

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 5월 18일 오전 10:31

댓글 0