
databricks
Staff Software Engineer - AI Research Infrastructure
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Databricks에서 AI 연구를 위한 대규모 인프라를 설계하고 운영할 Staff Software Engineer를 채용합니다. 수천 개의 GPU를 활용하는 훈련 및 추론 워크로드를 최적화하고, 연구원들의 생산성을 높이는 분산 시스템 및 도구를 구축하는 것이 핵심입니다.
주요 업무
대규모 실험, 데이터 처리 및 모델 훈련을 지원하는 인프라(HPC 클러스터, GPU 플릿, 클라우드 시스템) 설계 및 구현, 작업 제출·스케줄링·모니터링을 위한 강력한 추상화 계층 구축, 실험 관리 시스템 및 CI/테스트 인프라 등 연구 생산성 향상 도구 제작, Databricks AI Research의 장기 컴퓨팅 로드맵 수립 참여, 컴퓨팅·인프라·AI 시스템 분야의 기술 멘토링 수행.
자격 요건
컴퓨터 과학 또는 관련 분야 학사/석사/박사 학위 소지자, 5년 이상의 소프트웨어 엔지니어링 경험(대규모 분산 시스템 또는 인프라 분야 필수), C++, Rust, Go, Java, Scala 중 하나 이상의 시스템 프로그래밍 언어 숙련, Kubernetes, Slurm, Ray 또는 자체 내부 시스템과 같은 클러스터 스케줄러 및 리소스 관리자 구축/기여 경험, 현대적인 ML 훈련 및 추론 워크플로우(분산 훈련, 모델 병렬화, 파인튜닝 등)에 대한 이해, 복잡한 서비스를 프로토타입에서 안정적인 서비스까지 주도할 수 있는 능력, 연구원 및 엔지니어와의 원활한 커뮤니케이션 능력.
기술 스택
C++RustGoJavaScalaKubernetesSlurmRayGPUDistributed SystemsHPCCloud ComputingML Infrastructure
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Sr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DDelivery Solutions Architect
영업, 고객지원Solutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원