
turing
Frontier Data Lead - RL Gyms
AI 요약
Turing에서 Frontier Data Lead - RL 직무를 채용합니다. 이 직무는 최첨단 AI 연구소 및 기업을 위한 강화학습(RL) 환경 프로젝트의 설계, 작업 생성, 보상/검증자 설계, 품질 관리 및 납품까지 전 과정을 책임지는 기술 리더십 역할입니다. Python 및 SQL 경험을 갖춘 엔지니어링 관리 경험자와 시스템 사고 능력을 갖춘 인재를 찾고 있으며, AI 및 머신러닝 분야의 최전선에서 실질적인 영향을 미칠 기회를 제공합니다.
주요 업무
RL 환경 프로젝트의 엔드투엔드 책임 (설계, 작업 생성, 보상/검증자 설계, 품질, 납품)
RL 환경 및 관련 데이터의 품질 관리 (현실성, 난이도, 다양성)
팀 빌딩 및 역량 강화 (엔지니어, 주제 전문가, 연구원, 데이터 운영 팀원 관리)
프로세스 리더십 (환경 코드, 데이터베이스 스키마, 시드 데이터, 작업, 검증자 생성 프로세스 설정)
고객 상호작용 (고객 관계 관리, 정기 업데이트 제공, 피드백 수렴, 프로젝트 범위 및 수익 기회 발굴)
영업 및 솔루션링 (고객 요구사항 이해 및 환경 목표로 번역)
Evals & Post-training (내부 RL 파인튜닝 실험 실행 또는 평가 보고서 생성)
자격 요건
RL 및 후처리 경험 (RL 파인튜닝, 검증자/보상 설계, 환경 설계 경험)
엔지니어링 관리 경험 (팀 리딩, 인터뷰/채용, QA 프로세스 설정 경험)
시스템 사고 + 데이터베이스/API 설계 능력
실무 기술 역량 (Python, SQL 경험 선호)
운영 리더십 (복잡한 데이터 파이프라인, 다중 이해관계자 납품, 동시 고위험 프로젝트 관리 능력)
교차 기능 커뮤니케이터 (연구원, 주제 전문가, 다양한 팀과 명확한 소통 능력)
컴퓨터 과학, 머신러닝 또는 관련 기술 분야 배경 선호
기술 스택
PythonSQLReinforcement Learning (RL)