
openai
Research Engineer/Scientist - Human Alignment, Consumer Devices
AI·머신러닝연구·R&D개발
AI 요약
OpenAI의 Future of Computing Research 팀에서 개인화된 멀티모달 AI 시스템을 위한 RLHF 및 포스트 트레이닝을 담당할 연구 엔지니어/과학자를 채용합니다. 이 역할은 모델이 사용자의 맥락을 이해하고 장기적으로 유용한 행동을 하도록 보상 모델링, 선호도 학습, 평가 프레임워크 구축을 수행합니다. ML 연구 배경과 실증적 실험 설계 능력이 필수적이며, 제품 중심의 AI 혁신을 이끌 인재를 찾습니다.
주요 업무
멀티모달 모델을 위한 RLHF 및 포스트 트레이닝 방법론 개발, 적응형/개인화 모델 행동을 위한 보상 모델 및 선호도 학습 파이프라인 구축, 사용자 선호도 및 장기적 가치를 반영한 데이터셋 및 평가 프레임워크 설계, 명시적/암시적 피드백을 활용한 정책 개선 실험 수행, 안전 연구원과 협업하여 모델 정렬 및 제약 조건 준수 보장
자격 요건
강력한 머신러닝 연구 배경 (RLHF, 보상 모델링, 선호도 최적화, 대형 모델 포스트 트레이닝 경험 필수), 강화학습/랭킹/추천 시스템/개인화/메모리/Human-in-the-loop 평가 중 하나 이상의 경험, 엄격한 실증적 연구 및 실험 설계 능력, 데이터 생성부터 트레이닝 및 분석까지 전체 스택 작업 가능 역량, 멀티모달 AI 및 제품 중심 연구에 대한 높은 관심
기술 스택
RLHFReward ModelingPreference OptimizationPost-trainingReinforcement LearningMultimodal AIMachine LearningRankingRecommender Systems
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원B2B Marketing Lead, Korea
마케팅Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Personality
AI·머신러닝, 연구·R&D