
anthropic
Research Engineer, Machine Learning (Reinforcement Learning)
개발AI·머신러닝연구·R&D인프라·DevOps
AI 요약
Anthropic에서 Claude 모델의 성능과 안전성을 혁신할 강화학습(RL) 분야의 Research Engineer를 채용합니다. 연구와 엔지니어링 역량을 결합하여 차세대 AI 에이전트 시스템과 대규모 RL 인프라를 구축하는 핵심적인 역할을 수행하게 됩니다.
주요 업무
대규모 언어 모델을 위한 근본적인 강화학습(RL) 연구 및 구현, 컴퓨터 사용 및 자율 소프트웨어 생성을 위한 에이전트 모델 개발, GPU 클러스터 기반의 분산 실험 관리 및 RL 인프라 최적화, 모델의 추론 능력(수학 등) 향상, 새로운 훈련 환경 및 평가 방법론 설계 및 테스트
자격 요건
Python 및 Trio와 같은 비동기/동시성 프로그래밍 숙련도, PyTorch/TensorFlow/JAX 등 머신러닝 프레임워크 경험, 산업계 ML 연구 경력, 시스템 디자인 및 커뮤니케이션 능력, (우대) LLM 아키텍처 및 RL 기술 이해도, 가상화 및 샌드박스 환경 경험, Kubernetes, 분산 시스템 또는 고성능 컴퓨팅(HPC) 경험, Rust 또는 C++ 숙련도
기술 스택
PythonTrioPyTorchTensorFlowJAXKubernetesRustC++Distributed SystemsHPC