
anthropic
Anthropic Fellows Program — Reinforcement Learning
AI·머신러닝연구·R&D개발
AI 요약
Anthropic에서 2026년 7월에 시작하는 '강화학습(Reinforcement Learning) 펠로우십' 참가자를 모집합니다. 4개월간 풀타임으로 진행되는 이 프로그램은 Anthropic 연구진의 멘토링을 받으며 Claude 모델의 성능 개선 및 안전성 연구를 수행하고, 논문 등의 공개 결과물을 도출하는 것을 목표로 합니다. Python 숙련도와 강력한 기술적 배경이 필수입니다.
주요 업무
AI 학습 데이터 품질 개선을 위한 모델 기반 도구 구축, 일반화(Generalization) 관련 연구 프로젝트 수행, Claude 모델 역량 강화를 위한 RL 환경 구축, 안전 관련 작업을 위한 RL 환경 구축, RL 알고리즘 연구 및 솔루션 구현, 연구 결과의 공개적 출력(논문 등) 도출.
자격 요건
Python 프로그래밍 능통, 컴퓨터 과학/수학/물리학 등 관련 분야의 강력한 기술적 배경, 미국/영국/캐나다 내 풀타임 근무 가능 및 취업 자격 보유(비자 스폰서 불가). [우대사항] 복잡한 ML 시스템 구축 경험을 포함한 강력한 소프트웨어 엔지니어링 기술, 대규모 분산 시스템 및 고성능 컴퓨팅(HPC) 작업 경험, LLM 학습/미세 조정/평가 경험, 모델 학습 프로세스 분석 및 디버깅 능력.
기술 스택
PythonReinforcement LearningLLMDistributed SystemsHPCMachine LearningClaudeTransformerPyTorch