곽기은

SK 데이터 분석가

< 오픈소스를 활용하여 LLM 플랫폼 만들기 >

LLM이 활용할 데이터, VectorDB, LLM 등을 연결하고 다양한 agent를 생성할 수 있어야 함. 질의 응답 (QA) agent, chat agent, multi-agent 등 다양한 agent들이 있으며, 현재는 Langchain (https://www.langchain.com/) 툴킷을 활용하여 만들 수 있음.

하지만 Langchain이 현재는 속도 최적화가 되어있지 않고, document가 상대적으로 부실하기 때문에 활용이 조금 어려움. Langchain을 기반으로 framework로 만든게 LlamaIndex (https://www.llamaindex.ai/). Llama를 만든 메타에서 만들었으며, 보다 쉽게 agent를 만들 수 있음.

LLM을 활용할 때 가장 많이 사용하는 방법은, 나의 데이터를 LLM이 참고하게끔 하는 RAG (Retrieval Augmented Generation)인데, 이를 위해서는 VectorDB가 필수적임. VectorDB는 일반 데이터베이스와는 달리 임베팅을 저장하는 DB. 유사도를 기반으로 현재 쿼리와 가장 가까운 데이터를 탐색하며, 뒷단에는 Annoy 알고리즘을 가장 많이 활용함. 대표적인 VectorDB는 Pinecone (https://www.pinecone.io/)이 있다. 만약 권한관리까지 필요하다면 Milvus (https://milvus.io/)가 좋은 선택.

VectorDB는 클라우드에 올릴지, 아니면 빠르게 로컬에 만들고 지울지 등에 따라 장단점이 있음. 여기 https://benchmark.vectorview.ai/vectordbs.html vectorDB들을 비교분석하였으니 참고. 가벼운 사용에는 pinecone, Chroma, Faiss 정도를 많이 사용함.

실제 production에 LLM 서비스를 제공하고자 할 때에는, 사용자의 특정 인풋을 거를 수 있어야 한다. 예를 들어 폭력적인 내용이나, 현재 LLM이 목표로 하는 서비스와 다른 쿼리인 경우, LLM이 결과를 generate하지 않도록 강제해야 한다. 폭력/정치 등의 주제에 대해서는 OpenAI가 활용하는 moderation api(https://platform.openai.com/docs/models/moderation)를 활용 할 수 있고, 특정 주제에 대해서는 아웃풋을 생성하고자 할 때엔 엔비디아에서 개발한 Nemo Guardrail (https://github.com/NVIDIA/NeMo-Guardrails)을 활용할 수 있다.

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 11월 4일 오전 1:37

저장 4 • 조회 1,080

함께 읽은 게시물

기묘한

트렌드라이트 발행인

4일 전

👕무신사가 마뗑킴 일본 매장을 성공시킨 비결은

브

무신사가 마뗑킴 일본 매장을 성공시킨 비결은

뉴닉

저장 3 • 조회 297

장홍석

스페이스오디티 부대표/CPO

2일 전

< 완벽한 계획은 없다, 그런데 왜 계획을 세울까? >

1. 작전계획이란게 왜 필요한 걸까?

•

댓글 1 • 저장 4 • 조회 758

장홍석

스페이스오디티 부대표/CPO

3일 전

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와 데이터로

댓글 1 • 저장 5 • 조회 715

최혁준

주식회사 데얼스 대표

2일 전

경험담)섣불리 판단하면 안되는 이유?

주말에 한식 뷔페에서 식사하던 중,

저장 4 • 조회 438

장홍석

스페이스오디티 부대표/CPO

19시간 전

< '모든 것을 받아들이기'의 진짜 의미 >

1. 아무것도 기대하지 않으면 현재를 살게 된다.

댓글 1 • 저장 3 • 조회 354

레드버스백맨

리서처 앤 라이터

3일 전

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것⟫

영

공공디자인, 중앙정부를 넘어 - 영국 디자인카운슬, 2025

www.designdb.com

저장 7 • 조회 608

비슷한 게시물

서지연 개발자

[Book] 랭체인으로 LLM 기반의 AI 서비스 개발하기

김문수 토스 데이터 엔지니어 | ex-뱅크샐러드

보통 기업의 AI 전략 - 데이터, 데이터, 데이터

강병진 GS 52g Studio 개발자

RAG를 활용할 때 임베딩과 vector search에 대해

영현 GeoAI 연구원

🧐 LLM 기반 솔루션이 실제 서비스에서 실패하는 이유

이명진 한국레드햇 솔루션 아키텍트

나만의 데이터를 ChatGPT가 활용하는 방법

김영욱 SAP France 프로덕트 매니저

<10분만에 AI 에이전트 이해하기>

주간 인기 TOP 10

K리그 프로그래머 커피한잔 개발자

개발자의 장애 공유 문화

석민 커리어 코치

위로

장홍석 스페이스오디티 부대표/CPO

< 뇌를 가장 빠르게 바꾸는 3가지 방법 >

달레 Apollo GraphQL Software Engineer

Dependabot을 통한 안전한 의존성 관리

레드버스백맨 리서처 앤 라이터

⟪스토리를 만드는 사람들⟫

우디디자인랩 대표ㅣ프로덕트 디자이너

브런치에서의 6년, 그리고 100만뷰

골빈해커 Chief Maker

📰 인공지능만으로 운영된 스타트업의 실패 카네기 멜론 대학교의

골빈해커 Chief Maker

ChatGPT의 Deep Researh에 GitHub을 연결 할

동크루트 AI 엔지니어, SW 엔지니어

5월 둘째주 - OpenAI 인수부터 마소에 반기까지. 다 하는군

이양일 NaverCloud 백엔드 개발자

주니어 개발자들이 읽으면 좋은 테크 아티클 모음📚

< 오픈소스를 활용하여 LLM 플랫폼 만들기 >

댓글 0

함께 읽은 게시물

👕무신사가 마뗑킴 일본 매장을 성공시킨 비결은

< 완벽한 계획은 없다, 그런데 왜 계획을 세울까? >

< 초동 100만 장, 그런데 팬은 어디 있죠? - 엔터 테크와 데이터로

경험담)섣불리 판단하면 안되는 이유?

< '모든 것을 받아들이기'의 진짜 의미 >

⟪디자인의 역할은 프로세스에서 낭비를 줄이고 생산성을 개선하는 것⟫

비슷한 게시물

주간 인기 TOP 10

추천 프로필