
anthropic
Research Engineer, Machine Learning (RL Velocity)
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Anthropic에서 강화학습(RL) 훈련 인프라의 효율성과 신뢰성을 책임질 Research Engineer를 채용합니다. RL Velocity 팀에 소속되어 연구원들이 대규모 모델을 더 빠르고 안정적으로 학습시킬 수 있도록 시스템 병목을 해결하고 핵심 플랫폼을 구축하는 역할을 수행합니다. 소프트웨어 엔지니어링 역량과 ML 인프라에 대한 깊은 이해가 요구되는 고영향력 직무입니다.
주요 업무
연구원들이 사용하는 RL 학습 인프라 구축 및 개선, RL 스택 전반의 병목 현상 식별 및 제거(디버깅, 프로파일링, 재설계), 연구원 및 인접 엔지니어링 팀(추론, 샌드박싱 등)과 협업하여 도구 개발, 연구 실행의 엔드투엔드 신뢰성 및 성능 책임, 대규모 RL 설계 결정 참여
자격 요건
탄탄한 소프트웨어 엔지니어링 기초 및 성능/신뢰성 시스템 구축 경험, ML 인프라·분산 시스템·연구 도구 관련 업무 경험, 저수준 성능 작업부터 RL 알고리즘까지 스택 전반을 다룰 수 있는 능력, 대규모 분산 학습(RL, Pre-training, Post-training) 경험 우대, JAX, PyTorch 또는 유사 ML 프레임워크 숙련도 우대, 연구와 인프라의 경계에서 빠르게 실행하고 반복할 수 있는 역량
기술 스택
RLJAXPyTorchDistributed SystemsML InfrastructureML Frameworks