
scaleai
Machine Learning Research Engineer, Agents - Enterprise GenAI
AI 요약
Scale에서 AI 시스템 개발을 가속화할 Agent MLRE를 채용합니다. 본 포지션은 최첨단 에이전트 강화 학습(RL) 훈련 및 구축 알고리즘을 실제 엔터프라이즈 데이터셋에 적용하여 최상의 성능을 달성하는 에이전트를 만드는 역할을 수행합니다. LLM 프로덕션 환경 구축 경험, RLHF/RLVR 등 후처리 방법론 경험, 관련 학위 소지자를 우대하며, AI 분야의 혁신을 주도하고 싶은 분들에게 적합합니다.
주요 업무
최첨단 모델 훈련 및 배포, 훈련 스택에 통합할 최첨단 알고리즘 연구, 독자적인 에이전트 구축 알고리즘을 활용한 에이전트 구축 (고성능 도구, 다중 에이전트 시스템, 복잡한 보상 정의 포함)
자격 요건
1-3년의 프로덕션 환경에서 LLM 구축 경험, RLHF/RLVR 및 PPO/GRPO와 같은 후처리 방법론 경험, 최근 2년 이내 NEURIPS, ICLR, ICML 등 최상위 학회 논문 발표 경험, 컴퓨터 과학 또는 관련 분야 석사 또는 박사 학위 소지자
기술 스택
LLMRLHFRLVRPPOGRPO