
soop
SRE Engineer
인프라·DevOps
AI 요약
SOOP 서비스의 안정적 운영을 위한 서비스 신뢰성(SRE) 및 인프라 운영 담당자 채용. SLO/SLI 기반 신뢰성 도입, Observability(모니터링·알람) 구축, IaC 기반 인프라 자동화, 장애 대응 및 재발 방지 체계 운영 등을 수행.
주요 업무
SLO/SLI 기반 서비스 신뢰성 도입 및 병목 구간 개선, Observability 시스템 구축(서비스 감시·가시성 확보), 모니터링 및 알람 체계 설계·개선, IaC 기반 인프라 자동화 및 운영, 장애 대응 및 재발 방지 체계 주도.
자격 요건
시스템 성능 분석 및 Capacity Planning 경험, Prometheus/Grafana/Datadog 등 모니터링 툴 사용 경험, Ansible/Terraform 등 인프라 자동화 경험, Kubernetes 기반 컨테이너 운영 경험 보유.
기술 스택
PrometheusGrafanaDatadogAnsibleTerraformKubernetesPythonGoShellScriptIaCObservabilitySLO/SLIBareMetalCloud