
databricks
Staff Software Engineer - GenAI inference
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Databricks에서 자사 Foundation Model API의 핵심인 GenAI 추론 엔진 아키텍처를 설계하고 최적화할 Staff 소프트웨어 엔지니어를 채용합니다. LLM 추론의 처리량 극대화와 지연 시간 단축을 위해 커널부터 분산 시스템까지 스택 전반을 다루는 고도의 기술적 역할입니다.
주요 업무
- Databricks Foundation Model API를 구동하는 추론 엔진 아키텍처 설계 및 구현
- 대규모 LLM 추론에 최적화된 모델 서빙 스택 개발 협업
- 연구원과 협력하여 새로운 모델 아키텍처(MoE, 활성화 압축 등)를 엔진에 도입
- GPU 및 가속기 전반의 지연 시간, 처리량, 메모리 효율성 및 하드웨어 활용도 최적화
- 추론 워크로드를 위한 확장 가능한 라우팅, 배치, 스케줄링, 메모리 관리 메커니즘 설계
- 분산 추론 인프라 통합 및 팀 간 협업 주도
- 벤치마크, 화이트페이퍼, 오픈소스 기여를 통한 대외 기술 영향력 행사
자격 요건
- 컴퓨터 과학 또는 관련 분야 학사/석사/박사 학위
- 성능 중심 시스템(performance-critical systems) 분야 6년 이상의 소프트웨어 엔지니어링 경력
- 복잡한 시스템 구성 요소의 아키텍처 결정 및 엔드투엔드 소유권 행사 경험
- ML 추론 내부 구조(Attention, MLPs, 양자화, 희소 연산 등)에 대한 깊은 이해
- CUDA, GPU 프로그래밍 및 주요 라이브러리(cuBLAS, cuDNN, NCCL 등) 활용 능력
- 분산 시스템 설계(RPC 프레임워크, 큐잉, 샤딩, 메모리 파티셔닝 등) 배경 지식
- 커널, 메모리, 네트워킹, 스케줄러 등 레이어 전반의 성능 병목 현상 해결 능력
- (우대) ML 시스템, 추론 최적화 또는 모델 서빙 관련 연구 논문 발표 또는 오픈소스 기여 경험
기술 스택
CUDAGPU ProgrammingcuBLAScuDNNNCCLLLMRPCDistributed SystemsInference EngineQuantizationMoE
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DSr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Solutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원Delivery Solutions Architect
영업, 고객지원