옵저버빌리티 서비스인 Datadog에서 그동안 많은 모니터링 경험을 해보니 error rate보다 brun rate가 더 중요하다고 설명하는 글입니다.


error rate는 보통 서비스가 목표로 하는 SLO에서 1을 뺀 값으로 설정하는데 요청 수나 시간을 기준으로 전체 요청에서 에러가 얼마나 발생하는지를 백분율이나 수치로 잡아서 오류 예산을 잡을 수 있습니다. 여기서 오류 예산이라고 하는 부분은 특정 시간내에 오류를 얼마나 허용할 것인지를 정하는 것을 말하고 일부러 예산 개념을 넣어서 예상을 초과하면 배포를 막는다거나 시스템을 보호하기 위한 조치를 취할 수 있습니다.


burn rate는 SLO에서 오류 예산이 얼마나 빨리 소진되는지를 의미하는 것입니다.


이렇게 보면 이 둘은 거의 같아보일 수 있지만 error rate에는 요청수가 시간대나 기간에 따라 달라진다거나 하는 드으이 변수가 더 많은 반면 burn rate를 사용하면 오류 예산만 고려하여 오류가 높은지 아닌지를 보여줄 수 있기 때문에 더 정확한 상황을 파악할 수 있고 알림도 표준화 할 수 있고 알림 노이즈도 많일 줄일 수 있다고 설명하고 있습니다.


https://www.datadoghq.com/blog/burn-rate-is-better-error-rate/

Burn rate is a better error rate

Datadog

Burn rate is a better error rate

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 9월 25일 오후 4:00

 • 

저장 12조회 2,325

댓글 0

    함께 읽은 게시물

    디자인 컴포넌트 기반 AI 프로토타이핑

    A

    ... 더 보기

    - YouTube

    www.youtube.com

     - YouTube

     • 

    저장 15 • 조회 634


    야근의 관성

    제가 한국에서 직장 생활을 시작하고 가장 먼저 배운 것은 아이러니하게도 야근이었습니다. 신입이었던 제게 야근은 선택의 문제가 아니었거든요. 선배들에게 야근은 너무나 당연한 루틴이었고, 저녁 5시가 되면 "퇴근 안 해?"가 아니라 "저녁 뭐 먹을까?"라는 질문을 던졌습니다. 누가 정해놓은 것처럼 부장님이 퇴근해야 과장님이, 과장님이 퇴근해야 대리님이, 대리님이 퇴근해야 비로서 저 같은 신입도 퇴근 생각을 할 수 있었습니다.

    ... 더 보기

     • 

    저장 14 • 조회 3,283


    📝 2024년과 2025년 사이 생성형 AI 사용자의 행태 변화에 대한 HBR 리포트

    ... 더 보기

    오늘은 운영중인 프로젝트에 리얼 바이브코딩(채팅으로 요청만 함)을 시도 해 보았다. 😎


    바이브코딩만으로 원하는 기능을 완성한 뒤, 검토는 수제 코딩으로 진행했다.


    ... 더 보기

    억울한 돼지

    

    ... 더 보기

    Gemini CLI가 무료라길래 주말에 사용해봤습니다.


    기존에 만들던 프로젝트가 있는데, 현재 중간 기능까지만 완성된 상태인데요,

    시간과 의욕이 없어 중단된 상태였는데, 좋은 기회다 싶었습니다.

    ... 더 보기