Amazon Bedrock 지능적 프롬프트 라우팅 및 캐싱을 통해 비용 및 지연 시간 단축 (미리보기) | Amazon Web Services
Amazon Web Services
Prompt Caching은 AI 모델의 성능을 최적화하고 비용을 절감하는 강력한 기술입니다. 이 기능은 반복적으로 사용되는 프롬프트를 저장하여 처리 시간을 단축하고 비용을 줄이는 데 도움을 줍니다
작동 원리
프롬프트 캐싱은 다음과 같이 작동합니다:
자동 활성화: 1024 토큰 이상의 프롬프트에 대해 자동으로 적용됩니다.
캐시 조회: 시스템은 프롬프트의 초기 부분(접두어)이 이미 캐시에 저장되어 있는지 확인합니다.
캐시 히트: 일치하는 접두어가 발견되면 캐시된 결과를 사용하여 처리 시간과 비용을 줄입니다.
캐시 미스: 일치하는 접두어가 없으면 전체 프롬프트를 처리하고 향후 사용을 위해 접두어를 캐시합니다.
캐시 유지 시간: 캐시된 프롬프트는 일반적으로 5~10분 동안 유지되며, 비피크 시간에는 최대 1시간까지 유지될 수 있습니다.
Amazon Bedrock Prompt Caching – 여러 모델 간접 호출에서 자주 사용하는 컨텍스트를 프롬프트에 캐시할 수 있습니다. 이 기능은 사용자가 동일한 문서에 대해 여러 질문을 하는 문서 Q&A 시스템이나 코드 파일에 대한 컨텍스트를 유지해야 하는 코딩 도우미와 같이 동일한 컨텍스트를 반복적으로 사용하는 애플리케이션에 특히 유용합니다. 캐시된 컨텍스트는 각 액세스 후 최대 5분 동안 사용할 수 있습니다.
Amazon Bedrock의 프롬프트 캐싱은 지원되는 모델의 비용을 최대 90%, 지연 시간을 최대 85% 절감할 수 있습니다.
https://aws.amazon.com/ko/blogs/korea/reduce-costs-and-latency-with-amazon-bedrock-intelligent-prompt-routing-and-prompt-caching-preview/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 12월 31일 오후 12:40
혼다가 재사용로켓 시험발사에 성공. 시험체는 홋카이도 다이키에서 271 m 상공까지 도달한 후 무사히 착륙.
... 더 보기PM을 위한 상황별 프롬프트가 잘 정리되어 있는 곳!