DASH 2024: Guide to Datadog's newest announcements
Datadog
25일부터 26일까지 미국 뉴욕에서 Datadog의 기술 컨퍼런스인 Dash가 열렸고 이 키노트에서 많은 새 기능을 발표했습니다.
요즘 시대에 맞게 LLM 어플리케이션을 모니터링할 수 있는 LLM Observability도 있지만 인프라 작업을 주로 하다보니 관련한 기능에 많은 관심이 갔고 개인적으로는 키노트를 보면서 충격적이라고 생각할 정도로 Datadog이 잘하고 있다는 생각이 들었습니다.
Datadog 에이전트에 OpenTelemtry Collector 기능이 들어갔습니다. 이건 OpenTelemtry가 사실 이 업계의 de-facto 표준이 되었기 때문에 자연스러운 흐름이라고 생각합니다.
Agentless scanning은 에이전트를 따로 설치하지 않고도 EC2나 Lambda에서 취약한 설정을 확인할 수 있습니다. 리소스를 어디까지 지원하는지는 봐야겠지만 에이전트를 설치하지 않고도 사용할 수 있다는 부분은 아주 강력한 부분이라고 생각합니다.
Kubernetes Autoscaling은 컨테이너의 65% 이상이 할당받은 리소스의 절반도 안쓴다는 점을 강조하면서 아낄수 있는 부분을 기존에 추천만 하던걸 이제 직접 적용할 수 있게 했습니다.(물론 현실의 Kubernetes 운영 방식을 생각하면 한계는 아직 꽤 있다고 봅니다.)
Changes Tracking은 대부분의 장애가 변경사항에서 발생하기 때문에 오류 그래프와 함게 배포나 피처플래그의 변경사항을 같이 확인할 수 있는 기능입니다. 개인적으로 중요하게 생각하는 부분인데 UI로 꽤 잘 풀었다고 생각합니다.
Bits AI가 더 발전해서 이제는 장애가 났을때 문제 상황을 정리하고 원인을 찾아주며 포스트모템의 문서까지 작성해 주어서 써봐야 겠지만 꽤 많은 부분을 도움을거라고 생각하고 여기에 이어서 on-call 기능을 발표해서 온콜 스케쥴링을 하고 이슈가 있을때 Bits AI와 연계해서 장애 대응을 할 수 있게 해주었습니다.(Pagerduty가 큰일났다는 생각이 들었습니다.)
그외 사용성은 봐야겠지만 라이브 데이터로 로켈에서 디버깅하는 Live Debugger도 나왔고(아직 Python만 됩니다.) 엔지니어외 전 직군이 사용할 수 있도록 Googla Analytics같은 Product Analytics도 출시해서 아주 커다란 플랫폼으로 키우려는 것을 느낄 수 있었습니다.
컨퍼런스에 와보니 Datadog이 최근 이 옵저버빌리티 시장에서 자리를 잡아서 Datadog 중심으로 생태계가 커지고 있다는 느낌을 받았습니다.
https://www.datadoghq.com/blog/dash-2024-new-feature-roundup-keynote/
다음 내용이 궁금하다면?
이미 회원이신가요?
2024년 6월 27일 오후 3:54