📈 성과지표(KPI), 이렇게 설정하고 관리합니다
레드버스백맨
https://huggingface.co/blog/embedding-quantization
보통 vector search에 사용되는 text embedding들은 float32 형태로 저장되는데요, 이 경우 상당히 많은 메모리를 차지한다는 단점이 있습니다.
이를 해결하고자 아래와 같은 방법이 제기되고 있습니다.
bit로 구성된 embedding을 따로 저장해 initial search (cosine similarity가 아닌 hamming similarity 적용)
상위 결과에 대해서 reranking/rescoring 할 때 flaot32 embdding을 사용
그 결과 ~40배의 검색 속도와 메모리 사용량 감소를 이루어냈고, 반면 성능은 ~96%를 유지했다고 합니다.
더 큰 dimension을 사용하는 embedding들에 더 효과적이었고, bit가 아닌 int8까지만 줄여도 유의미한 효과를 볼 수 있었다고 하네요.
직접 시험해보지 않으면 모르고, 한국어 관련 task에서 결과가 나온 것은 아니지만, 충분히 실험해 볼만한 주제라고 생각됩니다!
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 4월 4일 오전 11:39
이
... 더 보기팀에서 중간 직급을 맡게 된다는 건 무엇을 의미할까요? 아래로는 후배를 챙겨야 하고, 위로는 상사를 모셔야 하는 ‘이중고’에 시달리게 된다는 의미입니다. 후배를 챙기는 것보다 더 중요하고 더 난이도가 높은 게 상사와의 케미를 끌어올리는 건데요. 그런데 이게 말처럼 쉽지가 않습니다.
... 더 보기