개발자A

소프트웨어 엔지니어

SimChat + RAG(OPENAI Embedding + Retriev

지금까지 근근히 일하다가 시간날 때마다 계속해서 챗봇 기능을 더 업데이트 해야된다고 생각했습니다.

그리고 가장 관심있었던 RAG기능.

이걸 꼭 넣어야겠다 생각을 했었습니다.

그러나 오픈소스 모델인 Llama를 사용하려면 높은 사양의 GPU서버가 필요했기 때문에

Bert 모델을 통한 질문 유사도 측정 기능만을 적용시킨 후 반쯤 포기하고 있었습니다.

그래도 시대가 시대인 만큼 꼭 넣어봐야겠다는 욕심에 다시 제작을 시작했어요.

포인트는 다음과 같습니다.

1. meta의 Llama를 감당할 서버 비용은 답이 없다.... OpenAi의 API KEY를 사용하자....

2. 챗봇은 RAG기능이 반드시 필요하다. private한 Document내에서 답변하자.

(자기소개서, 동화책 소개, 문제집 제작, 제품 설명서 등등)

3. 파일을 복수로 등록해서 한번 Vectorize한다.

(일단 지원가능한 파일은 PDF, TXT, CSV, xlsx로 한정하자)

4. 속도는 어느정도 나오나? (로컬이라면 노답이지만 OPENAI를 이용하면 과금되어도 속도는 괜찮다)

대략적인 요구명세가 나왔습니다.

그럼 이제 흘러가는 순서를 이렇게 해봅니다

0. 해당 기능은 반드시 OPEN AI APIKEY가 필요하다.

1. 학습을 위한 데이터셋 파일을 업로드 할 수 있어야 한다.

2. 학습을 진행할 경우 업로드된 파일을 전부 load해서 병합시키고 embedding을 시키고 vectorStore 제작. 각 챗봇에 알맞은 domain별로 계층을 나누어 둔다.

3. vectorized 된 데이터 셋에 Rerive시킨 결과를 보여주도록 한다.

그래서 만들어진 결과 잘 작동이 되는 것 같습니다.

사용자 UI 및 서버파일 작성등이 생략되었지만, 생각보다 이것도 꽤나 걸렸습니다.

Exception처리가 정말 많더라구요....

그래도 RAG가 문제없이 되는걸 보니 뿌듯하기도 하구요 ㅎㅎ

다들 한번씩 들러서 질문하거나 챗봇 만들어서 사용해보셔도 좋습니다.

(챗봇 만들기)

https://simchat.aimor.site/

(자기소개서 챗봇 GPT 모드)

https://simchat.aimor.site/msg?c_key=a8228927-9bbb-448f-886b-9ed41997b192

SimChat + RAG(OPENAI Embedding + Retrieve)

왕곰의 취미박스

다음 내용이 궁금하다면?

이미 회원이신가요?

2024년 10월 14일 오전 8:25

함께 읽은 게시물

이재호

책 <일 잘하는 팀장> 저자. 네오위즈 AI 개발자

5일 전

쫓아다니지 말고 대응하라

두 카페가 있다. 두 카페 모두 점원이 주문을 받고 커피를 내리는 카페였다. 그런데, 어느 날 한 카페에서 키오스크를 도입했다. 그렇다면, 여전히 점원이 주문을 받는 카페보다 키오스크를 도입한 카페가 변화에 더 기민하게 대응하는 것일까? 그럴 수도 있고, 그렇지 않을 수도 있다. 변화에 기민하게 대응한다는 건, 변화를 빨리 도입한다는 것과는 다른 이야기이기 때문이다.

조회 639

골빈해커

Chief Maker

7월 20일

바이브 코딩 - 개발자들이 하는거

바이브 개발 - 일반사람이 하는거

저장 2 • 조회 2,458

골빈해커

Chief Maker

4일 전

예상대로 OpenAI에서 GPT-5를 발표했습니다.

댓글 1 • 저장 4 • 조회 1,590

달레

Apollo GraphQL Software Engineer

12시간 전

🍜 짜파게티가 왜 거기서 나와?

아

저장 1 • 조회 662

장홍석

스페이스오디티 부대표/CPO

하루 전

< 감정은 내가 아니다. 감정을 나와 분리하라 >

댓글 1 • 저장 1 • 조회 411

골빈해커

Chief Maker

하루 전

AI와의 페어 코딩은 애자일의 극의.

댓글 1 • 조회 1,153

비슷한 게시물

테디노트 지식 크리에이터👍

OpenAI SWARM 멀티에이전트 프레임워크

송요창 배민 프론트엔드 프로그래머

Gemini API 찍먹

HoJoong Kim Senior IT guy

[요즘IT]‘OpenAI DevDay 2024’ 최고급 청바지를 선보이다

이성규 스닙팟 CEO & Founder

OpenAI DevDay 2024 발표 내용

HoJoong Kim Senior IT guy

[Dev.to] 로컬로 실행할 수 있는 상위 5가지 AI 모델!

박승규 카카오계열사에서 이것저것 만드는 개발자

앤트로픽 퀵 스타트 - 앤트로픽 API로 빠르게 애플리케이션 제작하기

주간 인기 TOP 10

골빈해커 Chief Maker

오늘의 탐라는 “ChatGPT 쓰셨던데 그러고도 개발자입니까?”

김의중 프론트엔드 개발자

Claude Code 실전 가이드: AI 네이티브 개발자로 가는

Arawn Park Senior Engineer & Engineering Lead

넷플릭스는 왜 WebFlux를 사용하지 않을까?

psmon 블룸에이아이 서버 엔지니어

카프카를 우아하게 사용하기 -코틀린편

달레 Apollo GraphQL Software Engineer

알아 알아 알아! 🤣

장홍석 스페이스오디티 부대표/CPO

< 몇 번 졌는지는 중요하지 않다, 인생은 결국 득실차다 >

황경찬(Boaz) P.E.C CEO

"AI가 코드를 짜는 시대, 개발자의 가치는 무엇일까요?" 최근

정종윤 네이버 프론트엔드 개발자

👻 클라이언트에서 안전한 소셜 로그인 구현을 위한 OIDC와 PK

박승규 카카오계열사에서 이것저것 만드는 개발자

책이 출판되기 전 마지막 교정을 하고 있는데... GPT5가 출시

석민 커리어 코치

백엔드 개발자 이력서 고민

SimChat + RAG(OPENAI Embedding + Retriev

댓글 0

함께 읽은 게시물

쫓아다니지 말고 대응하라

🍜 짜파게티가 왜 거기서 나와?

< 감정은 내가 아니다. 감정을 나와 분리하라 >

비슷한 게시물

주간 인기 TOP 10

추천 프로필