
databricks
Senior GenAI Research Engineer - Optimization and Kernels
AI·머신러닝연구·R&D개발
AI 요약
Databricks의 Mosaic AI 조직 내 Scaling 팀에서 대규모 언어 모델(LLM) 학습 성능을 극대화할 Research Engineer를 채용합니다. GPU 커널 최적화, 분산 학습 프레임워크 설계, 메모리 최적화 등을 통해 AI 모델의 한계를 넓히는 역할을 수행하며, 최신 딥러닝 기술을 제품에 녹여내는 핵심적인 연구 개발 업무를 담당합니다.
주요 업무
커널 퓨전, 혼합 정밀도, 메모리 레이아웃 최적화 등을 통한 학습 성능 향상 주도, NVIDIA 아키텍처 타겟 고성능 GPU 커널(Attention, gradient computation 등) 설계 및 구현, 대규모 언어 모델을 위한 분산 학습 프레임워크 및 병렬화 전략(Data, Tensor, Pipeline, ZeRO) 설계, 엔드투엔드 학습 워크플로우 프로파일링 및 디버깅을 통한 성능 병목 해결, 최신 딥러닝 연구 성과를 제품화에 적용.
자격 요건
컴퓨터 공학 또는 관련 분야 학사/석사/박사 학위, ML 학습 애플리케이션을 위한 CUDA 커널 작성 및 튜닝 경험, 분산 학습 프레임워크(PyTorch DDP, DeepSpeed, Megatron-LM, FSDP) 실무 경험, NVIDIA GPU 아키텍처(메모리 계층, 텐서 코어 등)에 대한 깊은 이해, CUDA 디버깅 및 프로파일링 도구(Nsight, NVProf) 숙련도, 대규모 모델 학습을 위한 병렬화 및 메모리 최적화 전략 이해, Python 및 PyTorch 기반의 강력한 소프트웨어 엔지니어링 기술, 하이퍼파라미터 튜닝 등 LLM 학습 역학에 대한 지식.
기술 스택
PythonPyTorchCUDADeepSpeedMegatron-LMFSDPNsightNVProfLLMGPU KernelsDistributed Training
databricks의 다른 공고
Sales Dev AI Program Manager
Director, Regional System Integrator Portfolio
영업Staff Research Engineer, Data Agents
AI·머신러닝, 연구·R&DSr. Specialist Solutions Architect - Data Engineering & Warehousing
영업Solutions Architect (Benelux Hunter Pre-sales)
영업Sr. Technology Partner Director, Business Applications
영업Delivery Solutions Architect
영업, 고객지원Delivery Solutions Architect
영업, 고객지원