모니터링, 알람 그리고 장애들

서비스를 개발하고 운영하면서 기능에 문제가 생기거나 정상작동하지 않는 경우를 현업에서는 "장애"라고 부릅니다. 회사의 정책에 따라서는 장애 레벨을 지정하고 장애의 종류에 따라 구분하여 관리하기도 하죠. 이런저런 시행착오들로 개발이 완료가 되고 사용자에게 서비스를 하게 되는 "배포"를 하게 되면 그걸로 끝이 아니라 만든 애플리케이션 혹은 서비스가 어떤 상태인지, "장애"가 발생하기 전에 사전에 먼저 확인이 가능할 수 있는 모니터링과 알람 시스템이 필요합니다.


저희 JSON 상하차 팀에서 이번에 이야기 한 주제는 "모니터링과 알림, 그리고 장애"에 대해 이야기를 나눴는데요. 각 회사에서는 어떻게 모니터링을 하고 장애를 관리하는지, 그리고 실제 모니터링/알림 시스템을 구현하고자 할 때 어떤 점을 고려해야 할지에 대해 공유합니다. 운영하시는 서비스 및 시스템에서는 어떤 식으로 모니터링/알림 시스템을 운영하고 있는지에 대해 함께 이야기해봐도 좋을 것 같습니다.


https://team-json-delivery.github.io/posts/metric-service/

모니터링, 알람 그리고 장애들 😊

Team JSON Delivery

모니터링, 알람 그리고 장애들 😊

다음 내용이 궁금하다면?

또는

이미 회원이신가요?

2024년 3월 20일 오후 2:50

 • 

저장 32조회 5,403

댓글 0

    함께 읽은 게시물

    GraphRAG 에 대한 생각

    2000년 초반부터 온톨로지 연구를 해왔고, 관심을 갖고 있는 사람으로서 GraphRAG 에 대해 갖고 있는 생각을 적어봤습니다.

    ... 더 보기

    AI(LLM) 애플리케이션의 발전 속도가 AI 지능(능력)의 발전 속도를 따라가지 못하고 있는 상태가 되었다. 즉, 이제 AI가 부족한 것이 문제가 아니라, AI의 능력을 100% 활용하지 못하고 있는 것이 문제인 상태가 되었다는 이야기.


    📰 OpenAI가 ChatGPT의 커넥터 기능을 업데이트하면서 MCP 지원을 추가했네요.

    ... 더 보기

    개발자의 코드리뷰는 상명하복이 아니다.

    면접관으로 들어가면 꼭 하는 질문들이 여러 개가 있다.

    ... 더 보기

    조회 226


    ChatGPT 버전명 설명

    ChatGPT 사용할 때 어떤 모델을 선택해야할지 망설여집니다. 모델명만 봐서는 어떤게 좋은지 모르겠더라고요.

    ... 더 보기

    앱 개발 개척시대

    A

    ... 더 보기

    앱 개발 개척시대

    K리그 프로그래머

    앱 개발 개척시대

     • 

    저장 2 • 조회 947