모니터링, 알람 그리고 장애들

서비스를 개발하고 운영하면서 기능에 문제가 생기거나 정상작동하지 않는 경우를 현업에서는 "장애"라고 부릅니다. 회사의 정책에 따라서는 장애 레벨을 지정하고 장애의 종류에 따라 구분하여 관리하기도 하죠. 이런저런 시행착오들로 개발이 완료가 되고 사용자에게 서비스를 하게 되는 "배포"를 하게 되면 그걸로 끝이 아니라 만든 애플리케이션 혹은 서비스가 어떤 상태인지, "장애"가 발생하기 전에 사전에 먼저 확인이 가능할 수 있는 모니터링과 알람 시스템이 필요합니다.


저희 JSON 상하차 팀에서 이번에 이야기 한 주제는 "모니터링과 알림, 그리고 장애"에 대해 이야기를 나눴는데요. 각 회사에서는 어떻게 모니터링을 하고 장애를 관리하는지, 그리고 실제 모니터링/알림 시스템을 구현하고자 할 때 어떤 점을 고려해야 할지에 대해 공유합니다. 운영하시는 서비스 및 시스템에서는 어떤 식으로 모니터링/알림 시스템을 운영하고 있는지에 대해 함께 이야기해봐도 좋을 것 같습니다.


https://team-json-delivery.github.io/posts/metric-service/

모니터링, 알람 그리고 장애들 😊

Team JSON Delivery

모니터링, 알람 그리고 장애들 😊

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 3월 20일 오후 2:50

 • 

저장 32조회 5,408

댓글 0

    함께 읽은 게시물

    진짜 1인 개발자 전성시대

    1

    ... 더 보기

    진짜 1인 개발자 전성시대

    K리그 프로그래머

    진짜 1인 개발자 전성시대

    📣 Interview Coaching 베타 릴리즈!!

    ... 더 보기




    [직장인을 위한 이솝우화] 제우스, 프로메테우스, 아테네, 모모스

    "

    ... 더 보기

    제우스, 프로메테우스, 아테네, 모모스

    Brunch Story

    제우스, 프로메테우스, 아테네, 모모스