databricks

Senior GenAI Research Engineer - Optimization and Kernels

AI·머신러닝연구·R&D개발

AI 요약

Databricks의 Mosaic AI 조직 내 Scaling 팀에서 대규모 언어 모델(LLM) 학습 성능을 극대화할 Research Engineer를 채용합니다. GPU 커널 최적화, 분산 학습 프레임워크 설계, 메모리 최적화 등을 통해 AI 모델의 한계를 넓히는 역할을 수행하며, 최신 딥러닝 기술을 제품에 녹여내는 핵심적인 연구 개발 업무를 담당합니다.

주요 업무

커널 퓨전, 혼합 정밀도, 메모리 레이아웃 최적화 등을 통한 학습 성능 향상 주도, NVIDIA 아키텍처 타겟 고성능 GPU 커널(Attention, gradient computation 등) 설계 및 구현, 대규모 언어 모델을 위한 분산 학습 프레임워크 및 병렬화 전략(Data, Tensor, Pipeline, ZeRO) 설계, 엔드투엔드 학습 워크플로우 프로파일링 및 디버깅을 통한 성능 병목 해결, 최신 딥러닝 연구 성과를 제품화에 적용.

자격 요건

컴퓨터 공학 또는 관련 분야 학사/석사/박사 학위, ML 학습 애플리케이션을 위한 CUDA 커널 작성 및 튜닝 경험, 분산 학습 프레임워크(PyTorch DDP, DeepSpeed, Megatron-LM, FSDP) 실무 경험, NVIDIA GPU 아키텍처(메모리 계층, 텐서 코어 등)에 대한 깊은 이해, CUDA 디버깅 및 프로파일링 도구(Nsight, NVProf) 숙련도, 대규모 모델 학습을 위한 병렬화 및 메모리 최적화 전략 이해, Python 및 PyTorch 기반의 강력한 소프트웨어 엔지니어링 기술, 하이퍼파라미터 튜닝 등 LLM 학습 역학에 대한 지식.

기술 스택

PythonPyTorchCUDADeepSpeedMegatron-LMFSDPNsightNVProfLLMGPU KernelsDistributed Training

AI 점수 98core

지원하기

Senior GenAI Research Engineer - Optimization and Kernels

AI 요약

주요 업무

자격 요건

기술 스택

databricks의 다른 공고

알림