Speed up PostgreSQL® pgvector queries with indexes
Aiven
모두의연구소는 지식을 나누며 함께 성장하는 국내 최대 AI 커뮤니티입니다.
1. Index를 사용하여 PostgreSQL pgvector 쿼리 속도 향상
이 글에서는 PostgreSQL의 pgvector 확장 기능을 사용하여 AI 임베딩을 저장하고 유사성 검색을 수행하는 방법을 소개합니다. pgvector는 표준 쿼리와 벡터 쿼리를 혼합한 하이브리드 검색을 지원하며, 검색 성능을 향상시키기 위한 다양한 유형의 인덱스 사용 방법과 인덱스 사용 시 출력 품질의 가능한 절충점에 대해서도 설명합니다.
https://aiven.io/developer/postgresql-pgvector-indexes
2. Python: 간편한 FastAPI 애플리케이션 모니터링
FastAPI를 사용하여 REST API를 출시한 후, 이제 API 모니터링을 구현하여 API 사용 방법과 성능을 파악하려고 합니다. API가 처리하는 요청 수, 가장 많이 사용되는 기능, 사용자가 직면하는 오류 유형, 성능 및 병목 현상, API의 가용성 등에 대해 알아보고자 합니다. FastAPI 자체는 이러한 질문에 답할 수 있는 수단을 제공하지 않으므로, 다른 방법을 모색해야 합니다.
https://apitally.io/blog/fastapi-application-monitoring-made-easy
3. LLM의 자웅을 겨룬다! CHATBOT ARENA
LLM에 대한 유저 선호도를 실시간으로 조사할 수 있는 크라우드소싱 평가 플랫폼을 UC Berkeley, UCSD 및 여러 학교의 공동연구기관 LMSYS와, Stanford가 함께 마련했습니다. CHATBOT ARENA에서는 사람의 피드백을 활용, 다양한 시나리오에서 LLM을 평가하게 됩니다. Elo 등급 시스템을 도입하여 게임화된 접근 방식이 구현되었으며, LLM 벤치마크로 확장가능합니다. 연구자들은 24만 건 이상의 투표를 모아 유의미한 ML 리더보드를 만들어냈습니다. 유저들은 다음의 링크를 통해 조사에 참여하여 arena를 체험할 수 있습니다.
https://chat.lmsys.org/
4. 드래그 한번으로 이미지를 조정하는 프레임워크, StableDrag
Tencent에서 새로운 point tracking을 적용, 마우스 포인터 드래그에 따라 이미지를 편집하는 StableDrag를 소개하였습니다. 기존의 연구에서는 부정확한 Point tracking과 불완전한 motion supervision으로 인해 불만족스러운 결과를 초래할 수 있다는 점을 지적하며, 이 부분을 개선해냈습니다. 우선 선택된 point와 주변의 특성을 추출하여 point 이동에 따라 추적하고, latent space에서 생성되는 결과물이 신뢰할만한지 특성과 비교하여 점수를 부여, 동적인 성능 향상을 꽤합니다.
https://stabledrag.github.io/
----
다른 생각에서 시작한 AI교육,
모두의연구소 AI학교 아이펠 온라인 8기
🔥 놓치지 마세요! ► https://bit.ly/3T1rC8r
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 3월 13일 오전 1:29