Jobs
anthropic 로고

anthropic

Full-Stack Software Engineer, Reinforcement Learning

개발AI·머신러닝데이터

AI 요약

Anthropic의 강화학습(RL) 조직에서 차세대 Claude 모델 학습을 위한 데이터 수집 및 환경 관리 플랫폼을 구축할 풀스택 소프트웨어 엔지니어를 채용합니다. Python과 React 기반의 기술 스택을 활용하여 연구원과 외부 벤더가 사용할 고성능 도구와 대시보드를 개발하며, AI 모델의 성능과 안전성에 직접적인 영향을 미치는 핵심 인프라를 담당합니다.

주요 업무

RL 환경 생성/관리/검토를 위한 웹 플랫폼 구축, 외부 파트너용 인터페이스 및 도구 개발, 대규모 인간 데이터 수집 및 피드백 시스템 설계, 연구용 평가 대시보드 및 관측 UI 개발, 환경 저작 도구와 학습 인프라를 연결하는 백엔드 서비스 및 API 구축, 확장 가능한 코드 데이터 생성 파이프라인 개발, 연구원 및 데이터 운영팀과의 협업을 통한 요구사항 구체화

자격 요건

탄탄한 소프트웨어 엔지니어링 기초 및 풀스택 개발 역량(DB 스키마부터 프론트엔드까지), Python 및 현대적 웹 스택(React, TypeScript 등) 숙련도, 복잡한 문제를 해결하고 시스템 효율을 극대화한 경험, 높은 주도성(High Agency) 및 UX에 대한 관심, 연구원 및 운영팀과의 원활한 커뮤니케이션 능력. (우대사항: 데이터 수집/라벨링 플랫폼 구축 경험, 클라우드 인프라(GCP/AWS) 및 Docker/CI/CD 경험, LLM 학습/미세조정/평가 워크플로우 이해, 비동기 Python(Trio, asyncio) 경험, 수학/물리 등 이공계 배경)

기술 스택

PythonReactTypeScriptDockerGCPAWSCI/CDTrioasyncioSQL
AI 점수 85core

anthropic의 다른 공고

알림

알림이 없습니다