
databricks
Software Engineer - GenAI inference
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Databricks에서 GenAI 추론 엔진을 설계하고 최적화할 소프트웨어 엔지니어를 채용합니다. LLM 서빙 시스템의 성능과 효율성을 극대화하기 위해 커널부터 분산 인프라까지 전체 스택을 다루며, 연구 결과물을 실제 프로덕션 시스템으로 구현하는 핵심적인 역할을 수행합니다.
주요 업무
GenAI 추론 엔진 설계 및 구현, 대규모 LLM 추론에 최적화된 모델 서빙 스택 협업, 새로운 모델 아키텍처(Sparsity, MoE 등)의 엔진 도입 및 최적화, GPU 및 가속기 활용도 최적화(Latency, Throughput, Memory), 성능 병목 분석을 위한 프로파일링 및 트레이싱 도구 구축, 확장 가능한 라우팅/배칭/스케줄링/메모리 관리 메커니즘 개발, 분산 추론 인프라 통합 및 로드 밸런싱
자격 요건
컴퓨터 공학 또는 관련 분야 학사/석사/박사 학위, 성능 중심 시스템(performance-critical systems) 분야 3년 이상의 소프트웨어 엔지니어링 경력, ML 추론 내부 구조(Attention, MLPs, Quantization, Sparse operations 등)에 대한 깊은 이해, CUDA 및 GPU 프로그래밍(cuBLAS, cuDNN, NCCL 등) 실무 경험, 분산 시스템(RPC, Queuing, Sharding, Memory partitioning 등) 설계 및 운영 능력, 커널/메모리/네트워킹 등 레이어 전반의 성능 병목 해결 능력, (우대) ML 시스템/추론 최적화/모델 서빙 관련 연구 논문 발표 또는 오픈소스 기여
기술 스택
CUDAcuBLAScuDNNNCCLRPCLLMGPUGenerative AIDistributed Systems
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DSr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Solutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원Delivery Solutions Architect
영업, 고객지원