나만의 데이터를 ChatGPT가 활용하는 방법

ChatGPT는 일반적인 데이터에 대해 답변하고 작업하는 것에는 너무나도 뛰어나지만, 나만이 가지고 있는 데이터에 대한 답변이나 작업에는 한계가 있을 수 밖에 없죠. 하지만 나만의 데이터도 ChatGPT가 활용할 수 있게 한다면 어떨까요? 이번 기사는 나만의 데이터를 ChatGPT가 활용하는 방법을 소개하는 기사 공유합니다.😃 (출처: Medium)


<1분 안에 나만의 데이터로 ChatGPT 학습하기>

  • ChatGPT가 나만 가지고 있는 데이터를 활용하게 되면, 보다 나에게 특화된 답변이나 작업을 지시할 수 있습니다.

  • embedchain이라는 오픈 소스 프레임워크를 사용하여 자신의 데이터에 대해 ChatGPT를 수행하는 방법을 소개합니다.


🥇 자신의 데이터를 사용하여 채팅을 수행하는 두 가지 방법

  1. LLM 미세 조정(Fine tuning)

  2. 검색 증강 생성(RAG, Retrieval Augmented Generation)


🥈 LLM 미세 조정(Fine tuning)

  • LLM 미세 조정은 미세 조정을 위해 직접 데이터가 필요하므로 시간이 많이 걸리는 프로세스입니다.

  • 데이터가 업데이트되는 경우(예: 새 이메일 또는 새 캘린더 이벤트) LLM을 지속적으로 또는 적어도 주기적으로 미세 조정해야 합니다.


🥉 검색 증강 생성(RAG, Retrieval Augmented Generation)

  • RAG는 LLM이 답변을 생성하기 전에 쿼리에 대한 관련 컨텍스트를 검색하여 LLM에 전달하고 LLM이 환각(hallucinate) 없이 데이터에서만 질문에 답변하도록 기반을 요청하기 때문에 파인 튜닝에 비해 보다 효율적일 수 있습니다.


💌 RAG 구현하기

  • Python과 embedchain이라는 오픈 소스 프레임워크를 사용합니다.

  • 데이터와 채팅할 수 있는 RAG용 앱을 만들기 위한 3단계 방법

    • 필요한 라이브러리 설치(여기서는 embedchain).

    • 앱을 만들고 데이터세트를 추가

    • 앱 사용


원본 기사 링크는 아래와 같습니다. 실제 구현 코드는 원본 기사 링크를 참고해 주세요. 감사합니다.🙏

[Source Link] https://levelup.gitconnected.com/train-chatgpt-on-your-own-data-in-1-minute-a3028ff5ded1

Train ChatGPT on your own data in 1 minute

Medium

Train ChatGPT on your own data in 1 minute

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 21일 오전 8:32

 • 

저장 5조회 1,433

댓글 0