anthropic

Software Engineer, RL Data

개발인프라·DevOps품질·테스트연구·R&D

AI 요약

Anthropic의 RL Data 팀에서 Claude용 고품질 강화학습 데이터를 만드는 백엔드/인프라 성격의 엔지니어를 채용합니다. 데이터 수집 파이프라인, human feedback 도구, 실행 환경, QA 프레임워크를 설계·개선하며, 프롬프트/평가/그레이더를 반복적으로 다듬어 신뢰도 높은 학습 데이터를 대규모로 운영하는 역할입니다.

주요 업무

데이터 수집 파이프라인 및 관련 시스템을 엔드투엔드로 소유; 트랜스크립트 검토 및 prompt/eval/grader 반복 개선; reward hacking 탐지 및 환경 품질 보장을 위한 QA 프레임워크 개발; human data 수집을 빠르고 쉽게 만드는 인터페이스 구축; sandboxing/snapshotting/tool coverage 등 실행 환경 강화; 연구팀·도메인 전문가와 밀착 협업하여 파이프라인과 eval 설계 및 개선; 운영·보안·컴플라이언스 파트너와 협업해 시스템 배포; 외부 데이터 벤더와의 기술 관계 관리 및 온보딩.

자격 요건

필수: 현대적 프로그래밍 언어 1개 이상에 대한 강한 소프트웨어 엔지니어링 역량, 주로 Python과 TypeScript 사용; 백엔드 시스템 또는 인프라 설계·구축·운영 경험; 본인 업무에 AI 도구를 효과적으로 활용하는 능력; 문제를 엔드투엔드로 책임지는 태도; 적극적이고 명확한 커뮤니케이션 능력; 모호하고 빠르게 변하는 상황에서의 빠른 반복 작업 능력; 자신의 업무가 사회에 미치는 영향에 대한 관심. 우대: LLM-powered systems 구축 경험(prompt pipelines, evals, products with models in the loop), LLM 강화학습 경험(environment, rewards, graders, training data), forward deployed engineer/founder/early startup 경험, 사용자 대상 제품 또는 내부 플랫폼 개선 경험, 데이터 파이프라인/통합 구축 경험, MCP servers 등 서드파티 도구/API 연동 경험, containers/Kubernetes/simulation infrastructure 경험, 민감 데이터 또는 강한 보안 통제 환경 경험, 외부 데이터 벤더 협업 경험, AI safety 또는 security research 기초 이해.

기술 스택

PythonTypeScriptLLMprompt pipelinesevalsgraderscontainersKubernetessimulation infrastructureMCP servers

AI 점수 95core

지원하기

Software Engineer, RL Data

AI 요약

주요 업무

자격 요건

기술 스택

anthropic의 다른 공고

알림