11화 요약하며 읽기
Brunch Story
Claude에 Prompt Caching 기능이 추가되었습니다. 캐싱 기능 사용시 첫 입력은 25% 비싸지지만, 이후 가격은 1/10, 레이턴시는 1/7로 낮춰줍니다.
개인적으로는 레이턴시 낮춰주는게 매력적인데요. 검색이나 데이터 처리, 코딩, 일반적인 채팅 서비스는 물론, 실시간 음성 대화 서비스 같은 걸 만든다고 하면 더더군다나 응답 레이턴시가 사용자 경험에 큰 영향을 미치기 때문입니다.
특히 RAG를 최소화하거나 사용하지 않도록 필요한 정보를 시스템 프롬프트에 최대한 우겨넣고 서비스를 해도, 비용 뿐 아니라 레이턴시면에서 손해를 보지 않으면서 더욱 정확한 정보를 제공 할 수 있으니까요.
Anthropic이 최근 응용 면에서도 꽤 빠르게 추격하거나 앞서나가고 있는 모양새인데요. 과연 Anthropic이 OpenAI를 뛰어넘을 수 있을까요? 오늘도 팝콘 하나 더 뜯어봅니다. 😎🍿🥤
더 많은 콘텐츠를 보고 싶다면?
이미 회원이신가요?
2024년 8월 14일 오후 5:43
‘
... 더 보기많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.
... 더 보기지
... 더 보기