
Site Reliability Engineer II, tvScientific
인프라·DevOps
AI 요약
tvScientific의 Site Reliability Engineer 포지션으로, AWS·Kubernetes/EKS·ArgoCD 기반 클라우드 네이티브 플랫폼의 안정성, 확장성, 자동화, 관측성을 책임집니다. Terraform/Terragrunt, GitHub Actions, Helm, Bash/Python을 활용한 인프라 운영 및 CI/CD 고도화가 핵심이며, 장애 대응과 사후 개선도 수행합니다.
주요 업무
프로덕션 인프라 및 플랫폼 서비스의 reliability/availability/performance 확보, Kubernetes 플랫폼 운영 및 확장, 멀티테넌트 워크로드 거버넌스·지원, ArgoCD/Helm 기반 GitOps 배포 관리, Terraform/Terragrunt로 인프라 프로비저닝 및 변경 관리, GitHub Actions 기반 CI/CD 자동화 구축, 장애 대응 및 RCA/사후 개선, Bash/Python으로 운영 자동화 및 toil 감소, 로그·메트릭·트레이스·대시보드·알림 등 observability 고도화, secrets/IAM/guardrails 운영 지원, 앱·보안·플랫폼 팀과의 협업을 통한 신뢰성 및 배포 품질 개선.
자격 요건
필수: SRE/DevOps/Platform Engineering/Cloud Infrastructure 경력 4년 이상, AWS 프로덕션 운영 경험, Kubernetes 클러스터 운영·트러블슈팅·플랫폼 관리 경험, Kubernetes multi-tenancy 경험(namespace, RBAC, quota, policy, tenant isolation), ArgoCD 기반 GitOps 운영 경험, Helm 실무 경험, Terraform/Terragrunt 경험, Bash 및/또는 Python 스크립팅 능력, GitHub Actions 등 CI/CD 파이프라인 구축·운영 경험, Linux/containers/IAM/networking/distributed systems 문제 해결 능력, monitoring/alerting/observability 경험, incident handling 및 production issue 해결 경험, engineering/security/platform 팀과의 협업 및 커뮤니케이션 능력, 컴퓨터공학/공학 관련 학사 또는 동등 경험. 우대/추가 요구: AI를 활용해 업무 속도와 품질을 개선할 수 있는 능력, AI-assisted work에 대한 비판적 검토(테스트, source-checking, data validation, peer review), 민감정보 보호 및 최종 책임 의식.
기술 스택
AWSKubernetesEKSArgoCDGitOpsHelmTerraformTerragruntGitHub ActionsBashPythonLinuxIAMcontainersmonitoringalertingobservabilitylogsmetricstracesdashboardsRBACnamespacesquotaspolicies
pinterest의 다른 공고
Sr. Data Scientist, Performance Marketing
데이터, 마케팅Client Account Manager II, E-Commerce
영업, 고객지원Performance Solutions Partner II
영업, 고객지원Staff Data Scientist, Ads Delivery
데이터, AI·머신러닝Sr. Software Engineer, Machine Learning, tvScientific
AI·머신러닝, 개발Staff Software Engineer, Ads Manager Platform
개발Sr. Software Engineer, Web
개발Software Engineer II, Web
개발