Site Reliability Engineer II, tvScientific

인프라·DevOps

AI 요약

tvScientific의 Site Reliability Engineer 포지션으로, AWS·Kubernetes/EKS·ArgoCD 기반 클라우드 네이티브 플랫폼의 안정성, 확장성, 자동화, 관측성을 책임집니다. Terraform/Terragrunt, GitHub Actions, Helm, Bash/Python을 활용한 인프라 운영 및 CI/CD 고도화가 핵심이며, 장애 대응과 사후 개선도 수행합니다.

주요 업무

프로덕션 인프라 및 플랫폼 서비스의 reliability/availability/performance 확보, Kubernetes 플랫폼 운영 및 확장, 멀티테넌트 워크로드 거버넌스·지원, ArgoCD/Helm 기반 GitOps 배포 관리, Terraform/Terragrunt로 인프라 프로비저닝 및 변경 관리, GitHub Actions 기반 CI/CD 자동화 구축, 장애 대응 및 RCA/사후 개선, Bash/Python으로 운영 자동화 및 toil 감소, 로그·메트릭·트레이스·대시보드·알림 등 observability 고도화, secrets/IAM/guardrails 운영 지원, 앱·보안·플랫폼 팀과의 협업을 통한 신뢰성 및 배포 품질 개선.

자격 요건

필수: SRE/DevOps/Platform Engineering/Cloud Infrastructure 경력 4년 이상, AWS 프로덕션 운영 경험, Kubernetes 클러스터 운영·트러블슈팅·플랫폼 관리 경험, Kubernetes multi-tenancy 경험(namespace, RBAC, quota, policy, tenant isolation), ArgoCD 기반 GitOps 운영 경험, Helm 실무 경험, Terraform/Terragrunt 경험, Bash 및/또는 Python 스크립팅 능력, GitHub Actions 등 CI/CD 파이프라인 구축·운영 경험, Linux/containers/IAM/networking/distributed systems 문제 해결 능력, monitoring/alerting/observability 경험, incident handling 및 production issue 해결 경험, engineering/security/platform 팀과의 협업 및 커뮤니케이션 능력, 컴퓨터공학/공학 관련 학사 또는 동등 경험. 우대/추가 요구: AI를 활용해 업무 속도와 품질을 개선할 수 있는 능력, AI-assisted work에 대한 비판적 검토(테스트, source-checking, data validation, peer review), 민감정보 보호 및 최종 책임 의식.

기술 스택

AWSKubernetesEKSArgoCDGitOpsHelmTerraformTerragruntGitHub ActionsBashPythonLinuxIAMcontainersmonitoringalertingobservabilitylogsmetricstracesdashboardsRBACnamespacesquotaspolicies

AI 점수 35tool

지원하기

AI 요약

주요 업무

자격 요건

기술 스택

pinterest의 다른 공고

알림