Jobs
databricks 로고

databricks

Staff Software Engineer, Foundational Model Serving

개발AI·머신러닝인프라·DevOps

AI 요약

Databricks에서 Llama, GPT 등 대규모 언어 모델(LLM)을 호스팅하고 서빙하는 'Foundation Model Serving' API 제품을 개발할 Staff Engineer를 채용합니다. 대규모 분산 시스템 및 백엔드 인프라 구축 경험이 핵심이며, GPU 워크로드 최적화와 고성능 추론 시스템 설계를 담당합니다.

주요 업무

Databricks Foundation Model Serving 핵심 시스템 및 API 설계/구현, 기술 로드맵 및 장기 아키텍처 정의, GPU 서빙 워크로드 최적화(성능, 처리량, 오토스케일링, 운영 효율성), vLLM 및 SGLang 등 주요 컴포넌트 기여, 토큰 기반 레이트 리미터 및 최적화 도구 개발, 제품/플랫폼/연구 팀과의 교차 기능적 협업, 코드 품질 및 테스트 베스트 프랙티스 수립, 기술 전략 영향력 행사.

자격 요건

10년 이상의 대규모 분산 시스템 구축 및 운영 경험, 고부하 및 운영에 민감한 백엔드 시스템 리딩 경험, 팀의 엔지니어링 우수성을 높인 실적, 알고리즘/자료구조/시스템 설계에 대한 강력한 기초 역량, 복잡하고 영향력 있는 기술 프로젝트 완수 능력, 뛰어난 커뮤니케이션 및 협업 능력, 전략적이고 제품 지향적인 사고방식, 엔지니어 멘토링 및 기술적 탁월함 배양에 대한 열정.

기술 스택

GPUvLLMSGLangDistributed SystemsAPIsEdge GatewaysML InferenceToken-based rate limiters
AI 점수 92core

databricks의 다른 공고

알림

알림이 없습니다