
scaleai
Staff Machine Learning Research Engineer, Agent Post-training - Enterprise GenAI
AI 요약
Scale에서 AI 애플리케이션 개발 가속화를 위한 Staff Agent Post-Training MLRE를 채용합니다. 본 포지션은 차세대 Agent RL 학습 플랫폼을 구축하고, 최첨단 연구를 학습 스택에 통합하여 엔터프라이즈 AI 팀의 ML 엔지니어들이 다양한 AI 활용 사례를 배포할 수 있도록 지원합니다. LLM 학습, RLHF/RLVR 등 후처리 기법 경험, 최상위 학회 논문 발표 경력, 관련 분야 석/박사 학위 소지자를 우대합니다. 연봉은 $180,600 - $315,000 USD이며, 스톡옵션 및 다양한 복리후생이 제공됩니다.
주요 업무
차세대 Agent RL 학습 플랫폼 구축, 최첨단 연구를 학습 스택에 통합, 엔터프라이즈 AI 팀의 ML 엔지니어들이 다양한 AI 활용 사례를 배포할 수 있도록 지원, 최첨단 모델 학습 및 배포, 최첨단 알고리즘 연구 및 학습 스택 통합, 복잡한 멀티 에이전트 시스템 학습 솔루션 설계
자격 요건
5년 이상의 LLM 학습 프로덕션 환경 경험, RLHF/RLVR 및 PPO/GRPO 등 관련 알고리즘 경험, 최근 2년 이내 NEURIPS, ICLR, ICML 등 최상위 학회 논문 발표 경력, 컴퓨터 과학 또는 관련 분야 석사 또는 박사 학위
기술 스택
LLMRLHFRLVRPPOGRPO