rate limiter - smudge.ai blog
Smudge
특정 사용자가 서비스의 리소스를 모두 차지하지 않도록 Rate Limit을 보통 사용하는데 이를 구현하는 알고리즘을 설명한 글입니다. 각 알고리즘을 애니메이션으로 비교해서 보여주기 때문이 이해하기 좋은 글입니다.
Fixed WIndow는 가장 간단하면서도 사용자가 예측하기 쉽지만 Windows가 시작 도리때 요청이 몰리거나 Window의 시간이 길다면 타임존의 영향을 받아서 Rate Limit이 의도와 다르게 동작할 수 있습니다.
Sliding Windows 방식은 동시에 받을 수 있는 요청수를 제한하기 때문에 요청을 원활하게 분산할 수 있지만 대신 적용하는데 리소스가 많이 필요합니다.
Token Bucket 방식은 버킷에 토큰이 있어야만 요청을 보낼 수 있는 방식으로 토큰은 일정 시간 간격으로 버킷에 채워지는 형태입니다. 유연한 방식이지만 사용자가 자신의 토큰이 어느정도 있는지 예측하기가 쉽지 않은 문제가 있습니다.
https://smudge.ai/blog/ratelimit-algorithms
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 6월 15일 오전 5:27
이
... 더 보기저를 포함한 주변에서 자주 보이는, AI에 대해 공부하는 단계별 순서입니다.
... 더 보기