모니터링 쪽에서는 최근에는 Datadog이 최강자인 느낌인데 빠르게 새로운 기능을 추가하면서 한 곳에서 모든 것을 연결해서 볼 수 있다는게 가장 큰 장점이라고 생각합니다. 물론 다 모으려면 그만큼
모니터링 쪽에서는 최근에는 Datadog이 최강자인 느낌인데 빠르게 새로운 기능을 추가하면서 한 곳에서 모든 것을 연결해서 볼 수 있다는게 가장 큰 장점이라고 생각합니다. 물론 다 모으려면 그만큼 비용이 들기는 합니다. APM을 중심으로 하고 있지만 로그 등 다양한 기능이 추가되고 있는데 최근에는 서비스 카탈로그 기능이 추가되어 Datadog에서 모니터링하는 서비스의 담당팀, 관련 슬랙, 문서 페이지, 온콜 등 다양하게 연결할 수 있게 되었고 모니터링 중 담당자를 쉽게 찾을 수 있는건 큰 장점이라고 생각합니다. 업무에서도 이부분을 사용하려고 고민하고 있긴 했는데 Datadog의 서비스 카탈로그를 활용한 경험을 정리한 글입니다. 이 글에서는 각 서비스의 카탈로그 정보를 업데이트하기 위해 Datadog Service Catalog Metadata Provier라는 GitHub Actions를 만들어서 사용했습니다. 각 저장소에서 해당 액션을 사용해서 워크플로우를 설정해서 바로 Datadog에 정보를 업데이트할 수 있고 이런 기능은 조직 차원에서의 관리가 필요하기 때문에 GitHub org 밑에 규칙파일을 두어서 업데이트할 때 필수 태그를 검사한다거나 유효한 값을 사용했는지 검사하는 등 조직적으로 관리할 수 있는 방법도 제공하고 있습니다. 괜찮은 접근이긴 한데 개인적으로는 회사에서는 조직 개편이나 담담자 변경 등 다양한 변화가 일어나고 누락된 팀을 관리하기 어렵다는 점에서 좀더 조직 차원에서 쉽게 관리할 수 있는 방법을 고민 중입니다. https://www.datadoghq.com/blog/github-actions-service-catalog/