Jobs
databricks 로고

databricks

Sr. Staff Technical Program Manager - Reliability

인프라·DevOps제품·기획·디자인

AI 요약

Databricks에서 멀티 클라우드 인프라의 신뢰성과 운영 우수성을 총괄할 Senior Staff Technical Program Manager(TPM)를 채용합니다. 10년 이상의 경력을 바탕으로 SRE 및 플랫폼 엔지니어링 팀과 협업하여 대규모 분산 시스템의 안정성을 확보하고 전사적 신뢰성 로드맵을 실행하는 고도의 기술 리더십 역할입니다.

주요 업무

신뢰성 전략 및 다분기 로드맵 수립; 플랫폼 엔지니어링, SRE, 보안 팀 간의 우선순위 조율; 엔드 투 엔드 프로그램 실행(계획, 리스크 관리, 의존성 매핑, 상태 보고); 분산 시스템 및 SRE 지식을 활용한 기술적 설계 및 우선순위 결정 지원; 조직 전반의 신뢰성 문화 고도화(에러 버짓, 장애 검토, 회복탄력성 설계 패턴 도입); 프로그램 거버넌스 및 지표 정의.

자격 요건

10년 이상의 클라우드 인프라, 분산 시스템, SRE 또는 플랫폼 엔지니어링 환경에서의 대규모 기술 프로그램 관리 및 인도 경험; AWS, Azure, GCP 중 2개 이상의 하이퍼스케일 클라우드 제공업체 인프라 개발 경험(클라우드 프리미티브, 멀티 AZ/리전 아키텍처 등); 가용성, 페일오버, 운영 우수성 등 대규모 신뢰성 프로그램 리딩 성공 사례; 분산 시스템 및 SRE 관행에 대한 깊은 이해; 모호한 목표를 실행 가능한 계획과 KPI로 변환하는 능력; 컴퓨터 공학 또는 관련 기술 분야 학사 학위(석사 이상 우대); [우대] 분산 시스템 엔지니어링 또는 SRE 배경, 컨테이너 오케스트레이션 및 오토스케일링 경험, SLO/에러 버짓/카오스 엔지니어링 숙련도.

기술 스택

AWSAzureGCPDistributed SystemsSRESLOsError BudgetsChaos EngineeringContainer OrchestrationAutoscalingJira

databricks의 다른 공고

알림

알림이 없습니다