Train ChatGPT on your own data in 1 minute
Medium
ChatGPT는 일반적인 데이터에 대해 답변하고 작업하는 것에는 너무나도 뛰어나지만, 나만이 가지고 있는 데이터에 대한 답변이나 작업에는 한계가 있을 수 밖에 없죠. 하지만 나만의 데이터도 ChatGPT가 활용할 수 있게 한다면 어떨까요? 이번 기사는 나만의 데이터를 ChatGPT가 활용하는 방법을 소개하는 기사 공유합니다.😃 (출처: Medium)
<1분 안에 나만의 데이터로 ChatGPT 학습하기>
ChatGPT가 나만 가지고 있는 데이터를 활용하게 되면, 보다 나에게 특화된 답변이나 작업을 지시할 수 있습니다.
embedchain이라는 오픈 소스 프레임워크를 사용하여 자신의 데이터에 대해 ChatGPT를 수행하는 방법을 소개합니다.
🥇 자신의 데이터를 사용하여 채팅을 수행하는 두 가지 방법
LLM 미세 조정(Fine tuning)
검색 증강 생성(RAG, Retrieval Augmented Generation)
🥈 LLM 미세 조정(Fine tuning)
LLM 미세 조정은 미세 조정을 위해 직접 데이터가 필요하므로 시간이 많이 걸리는 프로세스입니다.
데이터가 업데이트되는 경우(예: 새 이메일 또는 새 캘린더 이벤트) LLM을 지속적으로 또는 적어도 주기적으로 미세 조정해야 합니다.
🥉 검색 증강 생성(RAG, Retrieval Augmented Generation)
RAG는 LLM이 답변을 생성하기 전에 쿼리에 대한 관련 컨텍스트를 검색하여 LLM에 전달하고 LLM이 환각(hallucinate) 없이 데이터에서만 질문에 답변하도록 기반을 요청하기 때문에 파인 튜닝에 비해 보다 효율적일 수 있습니다.
💌 RAG 구현하기
Python과 embedchain이라는 오픈 소스 프레임워크를 사용합니다.
데이터와 채팅할 수 있는 RAG용 앱을 만들기 위한 3단계 방법
필요한 라이브러리 설치(여기서는 embedchain).
앱을 만들고 데이터세트를 추가
앱 사용
원본 기사 링크는 아래와 같습니다. 실제 구현 코드는 원본 기사 링크를 참고해 주세요. 감사합니다.🙏
[Source Link] https://levelup.gitconnected.com/train-chatgpt-on-your-own-data-in-1-minute-a3028ff5ded1
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 4월 21일 오전 8:32