
databricks
Staff Software Engineer, Foundational Model Serving
개발AI·머신러닝인프라·DevOps
AI 요약
Databricks에서 Llama, GPT 등 대규모 언어 모델(LLM)을 호스팅하고 서빙하는 'Foundation Model Serving' API 제품을 개발할 Staff Engineer를 채용합니다. 대규모 분산 시스템 및 백엔드 인프라 구축 경험이 핵심이며, GPU 워크로드 최적화와 고성능 추론 시스템 설계를 담당합니다.
주요 업무
Databricks Foundation Model Serving 핵심 시스템 및 API 설계/구현, 기술 로드맵 및 장기 아키텍처 정의, GPU 서빙 워크로드 최적화(성능, 처리량, 오토스케일링, 운영 효율성), vLLM 및 SGLang 등 주요 컴포넌트 기여, 토큰 기반 레이트 리미터 및 최적화 도구 개발, 제품/플랫폼/연구 팀과의 교차 기능적 협업, 코드 품질 및 테스트 베스트 프랙티스 수립, 기술 전략 영향력 행사.
자격 요건
10년 이상의 대규모 분산 시스템 구축 및 운영 경험, 고부하 및 운영에 민감한 백엔드 시스템 리딩 경험, 팀의 엔지니어링 우수성을 높인 실적, 알고리즘/자료구조/시스템 설계에 대한 강력한 기초 역량, 복잡하고 영향력 있는 기술 프로젝트 완수 능력, 뛰어난 커뮤니케이션 및 협업 능력, 전략적이고 제품 지향적인 사고방식, 엔지니어 멘토링 및 기술적 탁월함 배양에 대한 열정.
기술 스택
GPUvLLMSGLangDistributed SystemsAPIsEdge GatewaysML InferenceToken-based rate limiters
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Sr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DSolutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원Solutions Architect
영업