Jobs
zoom 로고

zoom

SRE - Linux Administration

인프라·DevOps

AI 요약

Zoom에서 글로벌 하이브리드 시스템 및 데이터 센터 인프라를 관리할 Site Reliability Engineer(SRE)를 채용합니다. 2~5년의 SRE 또는 DevOps 실무 경험자를 대상으로 하며, 시스템 모니터링, 자동화 스크립트 작성, CI/CD 파이프라인 구축 및 인프라 최적화를 담당하여 Zoom 서비스의 안정적인 가동을 책임집니다.

주요 업무

- 글로벌 데이터 센터 네트워크 내 신규 시스템 설치, 구성 및 모니터링 - 전 세계 수천 개의 물리 및 클라우드 시스템 패치 및 유지 관리 - 반복 작업 감소를 위한 Python 및 Shell 기반 자동화 스크립트 및 도구 개발 - 시스템 성능 메트릭 모니터링 및 분석을 통한 선제적 문제 해결 - 다중 환경에서 신속하고 안정적인 소프트웨어 배포를 위한 CI/CD 파이프라인 설계, 구현 및 유지 관리 - 중요 Zoom 인프라의 가동 시간 보장을 위한 프로덕션 시스템 모니터링, 트러블슈팅 및 최적화 - 타 팀과의 협업을 통한 시스템 성능 문제 해결 및 SRE 모범 사례 전파 - 프로덕션 장애 및 시스템 비상 사태에 대응하기 위한 24/7 온콜 로테이션 참여

자격 요건

- 컴퓨터 공학 또는 관련 전공 학사/석사 학위 - Site Reliability Engineering, DevOps 또는 Production Operations 분야에서 2~5년의 실무 경험 - Python 및 Shell 등 스크립팅 언어 능숙 - Ubuntu 중심의 Linux 시스템 관리 경험 - 온콜 근무, 장애 관리 및 인프라 변경/배포를 위한 야간/주말 근무 가능자 - 복잡한 시스템 문제를 진단할 수 있는 분석 및 문제 해결 능력 - CI/CD 파이프라인(Jenkins, GitLab CI) 및 버전 관리 시스템(Git) 경험 - 빌드 자동화, 구성 관리 도구(Ansible) 및 IaC 프로비저닝 도구(Packer/Terraform) 경험 - 베어메탈 인프라 및 데이터 센터 운영 경험 (Foreman, Cobbler, MAAS 등 운영체제 배포 도구 사용 능력 포함) - Kubernetes 사용 경험

기술 스택

PythonShellLinuxUbuntuJenkinsGitLab CIGitAnsiblePackerTerraformForemanCobblerMAASKubernetes

zoom의 다른 공고

알림

알림이 없습니다