OpenAI와 Anthropic에 비해 이슈가 덜 되어 있는 회사지만 조용하고 강한 LLM 회사인 Cohere 에서 새로운 임베딩 모델을 발표했는데요. 성능이 인상적입니다. 상용 임베딩 모델로는
OpenAI와 Anthropic에 비해 이슈가 덜 되어 있는 회사지만 조용하고 강한 LLM 회사인 Cohere 에서 새로운 임베딩 모델을 발표했는데요. 성능이 인상적입니다. 상용 임베딩 모델로는 거의 유일하게 사용할 수 있는, 특히 다국어로는 선택지가 거의 없던 OpenAI의 Ada 모델보다 성능이 좋다고 합니다. 특히 RAG에 사용하는 Retrieval과 Rerank 성능이 좋습니다. 발표한 수치로만 봤을 땐 한국어 성능이 꽤 좋은데요. 실제로 테스트 한 바로는 Ada보다 살짝 좋은 정도로 보입니다. 그리고 Cohere 모델만의 특징으로, 모델 사용 타입을 검색 문서와 쿼리로 구분 할 수 있어서 성능 최적화에 도움이 될 것 같습니다. LLM 애플리케이션을 만드는데는 Vector Search를 통한 RAG가 필수이고 매우 중요한데요. Ada 임베딩 모델의 업데이트가 없어서 아쉬웠던차에 좋은 대안이 나왔네요. 다만, GPTs/Assistant API의 RAG 성능이 좀 많이 부족하다는 피드백이 많아 이를 계기로 OpenAI서도 Ada 업데이트를 준비하지 않을까 싶네요. 어떻게 보면 생성 보다도 더 중요한 부분이라 임베딩 성능도 빨리 올려주면 좋겠습니다.