전동현

네이버 AI Research Engineer / Leader

Text Embedding Models

LLM 뿐만아니라 요즘은 Text Embedding 쪽도 기술 발전이 빠르고, 경쟁이 치열한데요.

Embedding 모델도 여러가지 모델들이 존재합니다.

LLM leaderboard와 같이 [MTEB leaderboard](https://huggingface.co/spaces/mteb/leaderboard)를 통해서 오픈소스 embedding 모델들의 현재 점수들을 확인할 수 있습니다.

하지만 많은 회사들이 Long-context 지원(8k input), 사용 편리성, 속도와 품질 등을 고려해서 open ai에서 만든 text-embedding-ada-002 모델을 많이 사용하고 있는데요.

(text-embedding-ada-002 내용 참고: https://openai.com/blog/new-and-improved-embedding-model)

최근 Jina AI에서도 8K context input을 지원하는 모델을 오픈소스로 공개했습니다. 자세한 설명은 아래의 링크를 참고해주세요.

참고 - https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai/?utm_source=pytorchkr

또한 Cohere에서는 MTEB leaderboard 등의 SOTA 모델로 Embed v3을 공개했으며, multilingual도 지원하고 있습니다. 실제로 국내 스타트업들에서도 cohere 의 multilingual 모델을 많이 사용하고 있는 것 같습니다. 자세한 설명은 아래의 링크를 참고해주세요.

참고 - https://txt.cohere.com/introducing-embed-v3/?utm_source=pytorchkr

Introducing Embed v3

Context by Cohere

다음 내용이 궁금하다면?

이미 회원이신가요?

2023년 11월 18일 오전 6:21

•

저장 8 • 조회 1,355

함께 읽은 게시물

석민

커리어 코치

하루 전

My Principles

저장 2 • 조회 300

장홍석

스페이스오디티 부대표/CPO

3일 전

< 내가 뭘 원하는지 도무지 모를 때 해야 할 단 한 가지 >

1. 하고 싶다고 생각한 것은 사실 당신의 마음속에서부터 나온 게 아니라, 상식이나 가족, 또는 친구의 기대에 영향받은 것이 많다.

댓글 1 • 저장 5 • 조회 800

골빈해커

Chief Maker

2일 전

몇가지 주제에 대해서 특허 출원을 해 두려고 정리중인데, Claude Code랑 ChatGPT Codex에게 소스에서 알아서 특허 될만한 것 좀 찾아서 정리해봐라고 해 보았다.

결과는 둘 다 상당히 어설프긴 했지만, 둘 다 내가 생각하고 있던 것도 일부 찾아내서 신기했다.

저장 1 • 조회 566

이양일

NaverCloud 백엔드 개발자

7월 18일

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

올

MCP 모르면 대체 얼마나 손해 보는 걸까? | 요즘IT

요즘IT

•

댓글 1 • 저장 28 • 조회 3,128

비슷한 게시물

이명진 한국레드햇 솔루션 아키텍트

프롬프트 개선을 위한 OpenAI의 제안 6단계

테디노트 지식 크리에이터👍

OpenAI SWARM 멀티에이전트 프레임워크

골든래빗 골든래빗 공식 계정

[Obsidian] 옵시디언+챗GPT로 제텔카스텐 구축하기

강병진 GS 52g Studio 개발자

LLM 어플리케이션에서 RAG대신 agent를 사용해야하는 이유

골빈해커 Chief Maker

📝 OpenAI에서 GPT Bulider의 프롬프트를 공식적으로 공개했습니다.

이명진 한국레드햇 솔루션 아키텍트

GPT 스토어로 수익을 창출하기 위한 4단계 가이드

주간 인기 TOP 10

권태관 NAVER 소프트웨어 엔지니어

퇴사 부검 : 네이버를 떠나며

이양일 NaverCloud 백엔드 개발자

요구사항 변화에 따른 프로젝트 구조 확장 ⛏

K리그 프로그래머 커피한잔 개발자

컨텍스트 스위칭 - AI 코딩 부작용

유용우(요우) NAVER 백엔드 개발자

"배포했으면 스펙이지"

장홍석 스페이스오디티 부대표/CPO

< 당신이 바쁜데도 성과가 없는 이유 >

석민 커리어 코치

살아있네

Annette MJ Kim 사람과 조직의 동반 성장을 위해 일해요:D

퇴근길 지하철에서 중년 사내와 20대 후반의 한 젊은이가 필자의

레드버스백맨 리서처 앤 라이터

《기다림이 허락되지 않는 시대》

달레 Apollo GraphQL Software Engineer

👦🐍 7살 아이에게 파이썬을 가르칠 수 있을까요?

Arawn Park Senior Engineer & Engineering Lead

전문가의 태도를 배울 수 있는 강의

Text Embedding Models

댓글 0

함께 읽은 게시물

My Principles

< 내가 뭘 원하는지 도무지 모를 때 해야 할 단 한 가지 >

MCP 모르면 대체 얼마나 손해 보는 걸까?🤔

비슷한 게시물

주간 인기 TOP 10

추천 프로필