
anthropic
Research Engineer, Machine Learning (Horizons)
개발AI·머신러닝연구·R&D
AI 요약
Anthropic의 Horizons 팀에서 Claude 모델의 강화학습(RL) 연구 및 인프라 구축을 담당할 Research Engineer를 채용합니다. AI 모델의 자율성, 코딩 능력, 추론 능력을 극대화하는 연구와 엔지니어링을 병행하며 세계 최고 수준의 AI 시스템을 구축하는 역할입니다.
주요 업무
강화학습(RL) 인프라 아키텍처 설계 및 최적화, GPU 클러스터 기반 분산 실험 관리, 차세대 모델을 위한 새로운 훈련 환경 및 평가 방법론 설계, LLM의 추론 및 코딩 능력 향상을 위한 RL 연구 수행, 에이전트 모델 개발 및 내부 생산성 도구 프로토타이핑, 연구 및 엔지니어링 팀 간 협업을 통한 자동화 테스트 프레임워크 및 API 설계.
자격 요건
Python 및 Trio와 같은 비동기/동시성 프로그래밍 숙련도, PyTorch/TensorFlow/JAX 등 머신러닝 프레임워크 경험, 머신러닝 연구 분야의 산업계 경력, 시스템 설계 및 커뮤니케이션 능력. (우대사항) LLM 아키텍처 및 훈련 방법론 이해, 강화학습 기술 및 환경 경험, 가상화 및 샌드박스 코드 실행 환경 경험, Kubernetes, 분산 시스템 또는 고성능 컴퓨팅(HPC) 경험, Rust 또는 C++ 숙련도.
기술 스택
PythonTrioPyTorchTensorFlowJAXKubernetesRustC++Distributed SystemsGPU clusters