Claude에 Prompt Caching 기능이 추가되었습니다. 캐싱 기능 사용시 첫 입력은 25% 비싸지지만, 이후 가격은 1/10, 레이턴시는 1/7로 낮춰줍니다.


개인적으로는 레이턴시 낮춰주는게 매력적인데요. 검색이나 데이터 처리, 코딩, 일반적인 채팅 서비스는 물론, 실시간 음성 대화 서비스 같은 걸 만든다고 하면 더더군다나 응답 레이턴시가 사용자 경험에 큰 영향을 미치기 때문입니다.


특히 RAG를 최소화하거나 사용하지 않도록 필요한 정보를 시스템 프롬프트에 최대한 우겨넣고 서비스를 해도, 비용 뿐 아니라 레이턴시면에서 손해를 보지 않으면서 더욱 정확한 정보를 제공 할 수 있으니까요.


Anthropic이 최근 응용 면에서도 꽤 빠르게 추격하거나 앞서나가고 있는 모양새인데요. 과연 Anthropic이 OpenAI를 뛰어넘을 수 있을까요? 오늘도 팝콘 하나 더 뜯어봅니다. 😎🍿🥤

더 많은 콘텐츠를 보고 싶다면?

또는

이미 회원이신가요?

2024년 8월 14일 오후 5:43

댓글 0

    함께 읽은 게시물

    요약하며 읽기

    ... 더 보기

    11화 요약하며 읽기

    Brunch Story

    11화 요약하며 읽기

    바이브 코딩이야말로 진정한 애자일이 아닌가.

    조회 2,711


    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기

    ... 더 보기

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

    Medium

    API 요청 당 쿼리 개수를 알고 싶어 라이브러리까지 만든 이야기 — 라이브러리 제작

     • 

    저장 39 • 조회 3,217


    많은 조직에서, 실험을 ‘revenue 지표 향상시키는 아이디어 찾아내기’ 내지는 ‘기획안 통과시키기 위한 근거찾기’ 정도로 여기곤 합니다. 그리고 그런 숫자들을 어떻게든 찾아내는 일을 데이터 분석이라고 부르려 하죠. 적어도 제가 리딩하는 팀에서 하고자 하는 실험과 분석은, 그런 것이 아닙니다.

    ... 더 보기

     • 

    저장 9 • 조회 1,335


    < 진짜 변화는 '비움'에서 온다 >

    1

    ... 더 보기

    한시간 반만에 Cursor로 만든 개발서적 경매서비스 후기

    ... 더 보기

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

    jasonkang14.github.io

    Cursor로 한시간 반만에 만든 책 경매 서비스 - Blog by Jason Kang

     • 

    저장 38 • 조회 3,801