
databricks
Staff Software Engineer - AI Research Infrastructure
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Databricks의 AI 연구 조직에서 수천 개의 GPU를 활용한 대규모 AI 모델 학습 및 추론 인프라를 설계하고 구축하는 Staff 소프트웨어 엔지니어를 채용합니다. 분산 시스템 및 클러스터 오케스트레이션 전문가로서 연구 생산성을 극대화하는 역할을 수행합니다.
주요 업무
대규모 실험, 데이터 처리 및 모델 학습을 지원하는 인프라(HPC 클러스터, GPU 플릿 등) 설계 및 구현, 작업 제출·스케줄링·모니터링을 위한 추상화 계층 구축, 실험 관리 시스템 및 CI/테스트 인프라 등 연구 개발 생산성 도구 제작, 연구 컴퓨팅 로드맵 수립 및 기술 멘토링 수행.
자격 요건
컴퓨터 과학 또는 관련 분야 학사/석사/박사 학위, 5년 이상의 소프트웨어 엔지니어링 경험(대규모 분산 시스템 또는 인프라 분야), 대규모 백엔드 서비스 및 데이터 파이프라인 구축/운영 경험(GPU 및 클라우드 환경), 시스템 프로그래밍 언어(C++, Rust, Go, Java, Scala 중 하나 이상) 숙련, 클러스터 스케줄러 및 리소스 관리 시스템(Kubernetes, Slurm, Ray 등) 기여 또는 구축 경험, 현대적 ML 학습 및 추론 워크플로우(분산 학습, 모델 병렬화, 파인튜닝 등)에 대한 이해.
기술 스택
C++RustGoJavaScalaKubernetesSlurmRayGPUHPCDistributed Systems
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DSr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Solutions Architect
영업Solutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원