🚌 Vector DB 버스 타실래요? Milvus!

(아재 개그스러운 제목에 대해 먼저 사죄드립니다. 🙇🏻‍♂️)


Vector DB 란 scalar 데이터가 아닌 vector embedding 을 저장/인덱스/쿼리를 하는 DB 를 말합니다.

embedding model 를 통해 특정 dimension 으로 벡터화 된 값을 관련 메타데이터와 함께 하나의 엔티티로 저장하게 되는데요,

속도와 정확성간의 trade-off 를 위해 인덱스 생성 후 Approximate Nearest Neighbor (ANN) 검색을 하는 형태로 동작합니다.


최근 RAG 와 관련된 프로젝트를 진행하면서 Milvus 라는 Vector DB 를 사용하게 되었는데요,

저희가 Milvus 를 사용하게 된 이유는 다음과 같습니다.


  • ANN benchmark(https://ann-benchmarks.com/index.html) 에서 milvus 는 성능상 상위 랭커이다.

  • 커뮤니티가 활성화되어 있다.

  • sdk 가 잘 되어 있다. (python, Go, Java, etc)

  • langchain-community 패키지에 통합이 잘되어 있다.(langchain 은 LLM 기반 어플리케이션 구현을 지원해주는 Framework 입니다.)

  • k8s 환경에서 scale out, scale up, fail over 이 가능하다.

  • on-disk index 를 포함해서 다양한 index 를 지원한다. (DiskANN 을 최초로 지원)

  • 지속적으로 release 되면서 유지 보수되고 있다.

  • 오픈소스이다. 공짜다.

  • admin tool 인 attu 가 공식적으로 오픈소스로 제공되고 있어 milvus manage 가 쉽다.


현재까지 프로젝트 진행하면서 특별한 말썽(?)을 일으키지 않고 준수한 성능을 보여주어 매우 만족하고 있습니다.


혹시나 Vector DB 를 고민하고 계신 분들이 있다면 Milvus 도 한번 검토해보시면 좋을것 같습니다.


📚 함께 보면 좋은 글

  • Milvus Document: https://milvus.io/docs/v2.3.x

  • Devocean Milvus Quick Start: https://devocean.sk.com/blog/techBoardDetail.do?ID=165368

Milvus vector database documentation Milvus v2.3.x documentation

milvus.io

Milvus vector database documentation Milvus v2.3.x documentation

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 6월 28일 오전 6:46

댓글 0

    함께 읽은 게시물

    정부가 한국의 기술 기업을 크게 키우고자 한다면 한국형이 아니라 글로벌형을 만들고 키워야한다. 소프트웨어, AI는 특히 더욱 그렇다. 한국형은 만들어봐야 한국에서만 경쟁력이 있는 것이니, 그건 경쟁력이 아니라 오히려 상한을 제한하는 것일 뿐이다. 즉, AI에 있어 K-를 붙이는 건 제약일뿐이다.

    조회 2,751


    Amazon CEO가 얘기하는 성공적인 커리어를 위한 최고의 팁 5가지


    ... 더 보기

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

    www.aboutamazon.com

    Amazon CEO Andy Jassy shares his top tips for a successful career: ‘Don’t be afraid to fail’

     • 

    저장 10 • 조회 1,733


    기획과 개발, 두 세계는 이어져야 한다.

    ... 더 보기

    01화 기획과 개발, 두 세계는 이어져야 한다.

    Brunch Story

    01화 기획과 개발, 두 세계는 이어져야 한다.

    🗞️ 간밤에 구글이 Gemini 2.5 Pro를 출시했는데요. 벤치마크 상으로는 GPT-4.5와 Claude 3.7 의 성능을 크게 뛰어넘는 결과를 보여줍니다. 특히 코딩능력이 매우 크게 향상되었는데요.

    ... 더 보기

     • 

    저장 4 • 조회 1,881


    살민 살아진다

    ... 더 보기

    사이드 프로젝트 34개를 만들고 느낀점 10가지

    1️⃣ 아이디어의 가치는 실행했을 때 비로소 생긴다.

    ... 더 보기

     • 

    저장 127 • 조회 4,655