
anthropic
Research Engineer, Machine Learning (RL Velocity)
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Anthropic의 RL Velocity 팀에서 강화학습(RL) 연구의 효율성과 신뢰성을 높일 Research Engineer를 채용합니다. 연구자들이 대규모 모델을 더 빠르고 안정적으로 학습시킬 수 있도록 인프라와 툴링을 구축하고 최적화하는 역할을 수행하며, 분산 시스템 및 ML 인프라에 대한 깊은 이해가 요구됩니다.
주요 업무
- 연구자들이 사용하는 RL 학습 인프라 구축 및 개선
- RL 스택 전반의 병목 현상 식별, 디버깅, 프로파일링 및 재설계
- 연구자 및 인접 엔지니어링 팀(추론, 샌드박싱 등)과 협업하여 도구 개발
- 연구 실행의 엔드투엔드 신뢰성 및 성능 책임
- 대규모 RL 수행 방식에 대한 설계 결정 참여
자격 요건
- 탄탄한 소프트웨어 엔지니어링 기초 및 신뢰성 있는 시스템 구축 경험
- ML 인프라, 분산 시스템 또는 연구용 툴링 작업 경험
- 저수준 성능 최적화부터 RL 알고리즘까지 스택 전반에 걸친 작업 능력
- 대규모 분산 학습(RL, Pre-training, Post-training) 경험 (우대)
- JAX, PyTorch 등 ML 프레임워크 숙련도 (우대)
- 관련 분야 학사 학위 또는 그에 준하는 교육/경험
기술 스택
RLJAXPyTorchDistributed SystemsML Infrastructure