Jobs
databricks 로고

databricks

Sr. IT Site Reliability Software Engineer

인프라·DevOps

AI 요약

Databricks IT Infrastructure and Operations 팀의 Site Reliability Engineer(SRE) 채용으로, 클라우드 기반 인프라를 IaC로 설계·자동화하고 관측성, CI/CD, 장애 대응 체계를 고도화하는 역할입니다. Python, Terraform/Pulumi, AWS/Azure/GCP, Kubernetes, Docker, Datadog, Prometheus, ELK, GitHub Actions 경험이 중요하며, 내부 AI 플러그인과 자동화 스크립트 개발도 포함됩니다.

주요 업무

클라우드 플랫폼(AWS/Azure)에서 프로덕션 인프라를 IaC로 설계·배포, 시스템 성능/아키텍처/스케일링 최적화, CI/CD 파이프라인 및 러너 운영, 신규 내부 애플리케이션의 보안·로그·메트릭·알림 기본 탑재, 내부 AI 플러그인 및 자동화 스크립트 개발, 인시던트 대응 및 기술 트러블슈팅, 온콜 참여, 블레임리스 포스트모템 진행, 대시보드 구축 및 서비스 헬스 유지, 보안/엔지니어링/서포트 팀과 협업.

자격 요건

필수: 5년 이상 프로덕션 수준의 소프트웨어 엔지니어링 경험, Python 숙련도(필수), Terraform(모듈/상태 관리) 또는 Pulumi 전문가 수준, AWS/Azure/GCP 및 Kubernetes/Docker 경험, Datadog/Prometheus/ELK 등 관측성 도구 경험, Kafka 또는 메시징 큐 이해, GitHub Actions 및 GitHub Runners 고급 활용 능력, 모호한 프로젝트를 독립적으로 실행하는 역량. 우대/참고: 내부 AI 플러그인 및 자동화 스크립트 개발 경험이 있으면 유리함.

기술 스택

PythonTerraformPulumiAWSAzureGCPKubernetesDockerDatadogPrometheusELKKafkaGitHub ActionsGitHub Runners
AI 점수 30tool

databricks의 다른 공고

알림

알림이 없습니다