모니터링, 알람 그리고 장애들 😊
Team JSON Delivery
서비스를 개발하고 운영하면서 기능에 문제가 생기거나 정상작동하지 않는 경우를 현업에서는 "장애"라고 부릅니다. 회사의 정책에 따라서는 장애 레벨을 지정하고 장애의 종류에 따라 구분하여 관리하기도 하죠. 이런저런 시행착오들로 개발이 완료가 되고 사용자에게 서비스를 하게 되는 "배포"를 하게 되면 그걸로 끝이 아니라 만든 애플리케이션 혹은 서비스가 어떤 상태인지, "장애"가 발생하기 전에 사전에 먼저 확인이 가능할 수 있는 모니터링과 알람 시스템이 필요합니다.
저희 JSON 상하차 팀에서 이번에 이야기 한 주제는 "모니터링과 알림, 그리고 장애"에 대해 이야기를 나눴는데요. 각 회사에서는 어떻게 모니터링을 하고 장애를 관리하는지, 그리고 실제 모니터링/알림 시스템을 구현하고자 할 때 어떤 점을 고려해야 할지에 대해 공유합니다. 운영하시는 서비스 및 시스템에서는 어떤 식으로 모니터링/알림 시스템을 운영하고 있는지에 대해 함께 이야기해봐도 좋을 것 같습니다.
https://team-json-delivery.github.io/posts/metric-service/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 3월 20일 오후 2:50
제
... 더 보기"
... 더 보기