Jobs
soop 로고

soop

SRE Engineer

인프라·DevOps

AI 요약

SOOP 서비스의 안정적 운영을 위한 서비스 신뢰성(SRE) 및 인프라 운영 담당자 채용. SLO/SLI 기반 신뢰성 도입, Observability(모니터링·알람) 구축, IaC 기반 인프라 자동화, 장애 대응 및 재발 방지 체계 운영 등을 수행.

주요 업무

SLO/SLI 기반 서비스 신뢰성 도입 및 병목 구간 개선, Observability 시스템 구축(서비스 감시·가시성 확보), 모니터링 및 알람 체계 설계·개선, IaC 기반 인프라 자동화 및 운영, 장애 대응 및 재발 방지 체계 주도.

자격 요건

시스템 성능 분석 및 Capacity Planning 경험, Prometheus/Grafana/Datadog 등 모니터링 툴 사용 경험, Ansible/Terraform 등 인프라 자동화 경험, Kubernetes 기반 컨테이너 운영 경험 보유.

기술 스택

PrometheusGrafanaDatadogAnsibleTerraformKubernetesPythonGoShellScriptIaCObservabilitySLO/SLIBareMetalCloud
AI 점수 40ops

soop의 다른 공고

알림

알림이 없습니다