#GPT4o 를 사용하여 PDF 내 표와 이미지를 참고하여 답변하는 #멀티모달 RAG
www.youtube.com
GPT-4o 출시 기념으로 "PDF" 문서내 이미지와 표를 참고하여 답변하는 #멀티모달RAG 를 구현했습니다.
링크: https://youtu.be/U_f4-Br3_Y0?si=mchn1HXqH19GvxEF
[요약]
- PDF 문서에 이미지, 표, 텍스트를 별도 추출
- 표, 이미지에 대한 요약 생성
- Query 에 대하여 유사도 계산 후 만약 image 요약본에 대한 검색이 상위결과라면 Image 를 GPT-4o 에 관련 텍스트와 함께 입력으로 넣어주고, 답변을 받습니다.
영상에서 사용한 PDF 예시는 Financial Report 입니다.
감사합니다! 즐거운 토요일 저녁 되세요!
#multimodal #gpt4o #rag
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 5월 18일 오전 10:31