Binary Quantization for Vector Search

https://huggingface.co/blog/embedding-quantization


보통 vector search에 사용되는 text embedding들은 float32 형태로 저장되는데요, 이 경우 상당히 많은 메모리를 차지한다는 단점이 있습니다.


이를 해결하고자 아래와 같은 방법이 제기되고 있습니다.

  1. bit로 구성된 embedding을 따로 저장해 initial search (cosine similarity가 아닌 hamming similarity 적용)

  2. 상위 결과에 대해서 reranking/rescoring 할 때 flaot32 embdding을 사용


그 결과 ~40배의 검색 속도와 메모리 사용량 감소를 이루어냈고, 반면 성능은 ~96%를 유지했다고 합니다.

더 큰 dimension을 사용하는 embedding들에 더 효과적이었고, bit가 아닌 int8까지만 줄여도 유의미한 효과를 볼 수 있었다고 하네요.


직접 시험해보지 않으면 모르고, 한국어 관련 task에서 결과가 나온 것은 아니지만, 충분히 실험해 볼만한 주제라고 생각됩니다!

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 4월 4일 오전 11:39

댓글 0

    함께 읽은 게시물

    [ 좋은 리더십은 좋은 팔로어십으로부터 ]

    01. 흔히 '리더십은 이끄는 것이고 팔로어십은 따르는 것'이라고 생각하기 쉽습니다. 뭐 구조만 두고 보면 아주 틀린 말은 아닙니다. 하지만 이를 마치 작용과 반작용처럼 생각하면 그때부터는 조직 내에서 큰 오해가 생길 수 있죠. 때문에 이 둘 사이의 방점은 '상호보완적'이라는데 찍혀야 함이 분명합니다. 02. 우리 주변에서 리더가 된 사람들 중 이런 유형이 있습니다. 일을 할 때 다른 사람들보다 자신의 의견을 더 잘 메이킹하고, 상위 리더의 지시를 누구보다 빠르게 잘 따르며, 피플 매니징에 대한 의욕이 높은... 더 보기

     • 

    저장 35 • 조회 2,680



    커서 AI를 슬랙과 연결하면 생기는 일

    ... 더 보기

    먹은 뒤의 흔적’만 보여준다. 하겐다즈의 광고에 주목하게 되는 이유

    ... 더 보기

    리더십

    

    ... 더 보기

    팀에서 중간 직급을 맡게 된다는 건 무엇을 의미할까요? 아래로는 후배를 챙겨야 하고, 위로는 상사를 모셔야 하는 ‘이중고’에 시달리게 된다는 의미입니다. 후배를 챙기는 것보다 더 중요하고 더 난이도가 높은 게 상사와의 케미를 끌어올리는 건데요. 그런데 이게 말처럼 쉽지가 않습니다.

    ... 더 보기