
anthropic
Research Engineer, Performance RL
AI·머신러닝연구·R&D개발
AI 요약
Anthropic의 Code RL 팀에서 모델의 코딩 및 추론 능력을 강화할 Research Engineer를 채용합니다. 강화학습(RL)을 활용해 Claude 모델이 안전하고 효율적인 코드를 생성하도록 환경을 설계하고 실험을 주도하며, 가속기 최적화와 분산 시스템 전반에 걸친 고도의 엔지니어링 업무를 수행합니다.
주요 업무
RL 환경 및 평가 지표 설계 및 구현, 연구 로드맵 형성을 위한 실험 수행, 훈련 실행(Training runs)에 작업물 전달, 가속기 성능 최적화 및 모델 학습 신호 생성, 타 연구원 및 엔지니어와의 협업
자격 요건
가속기(CUDA, ROCm, Triton, Pallas) 전문성, ML 프레임워크(JAX 또는 PyTorch) 프로그래밍 능력, 커널/모델 코드/분산 시스템 전반의 풀스택 경험, 연구 탐색과 엔지니어링 구현의 균형 감각, 관련 분야 학사 학위 이상 또는 그에 준하는 경험. (우대사항: 강화학습 경험, 가속기 간 ML 워크로드 포팅 경험, LLM 훈련 방법론 숙지)
기술 스택
CUDAROCmTritonPallasJAXPyTorchReinforcement LearningLLMDistributed SystemsKernels