openai

Research Engineer/Scientist - Human Alignment, Consumer Devices

AI·머신러닝연구·R&D개발

AI 요약

OpenAI의 Future of Computing Research 팀에서 개인화된 멀티모달 AI 시스템을 위한 RLHF 및 포스트 트레이닝을 담당할 연구 엔지니어/과학자를 채용합니다. 이 역할은 모델이 사용자의 맥락을 이해하고 장기적으로 유용한 행동을 하도록 보상 모델링, 선호도 학습, 평가 프레임워크 구축을 수행합니다. ML 연구 배경과 실증적 실험 설계 능력이 필수적이며, 제품 중심의 AI 혁신을 이끌 인재를 찾습니다.

주요 업무

멀티모달 모델을 위한 RLHF 및 포스트 트레이닝 방법론 개발, 적응형/개인화 모델 행동을 위한 보상 모델 및 선호도 학습 파이프라인 구축, 사용자 선호도 및 장기적 가치를 반영한 데이터셋 및 평가 프레임워크 설계, 명시적/암시적 피드백을 활용한 정책 개선 실험 수행, 안전 연구원과 협업하여 모델 정렬 및 제약 조건 준수 보장

자격 요건

강력한 머신러닝 연구 배경 (RLHF, 보상 모델링, 선호도 최적화, 대형 모델 포스트 트레이닝 경험 필수), 강화학습/랭킹/추천 시스템/개인화/메모리/Human-in-the-loop 평가 중 하나 이상의 경험, 엄격한 실증적 연구 및 실험 설계 능력, 데이터 생성부터 트레이닝 및 분석까지 전체 스택 작업 가능 역량, 멀티모달 AI 및 제품 중심 연구에 대한 높은 관심

기술 스택

RLHFReward ModelingPreference OptimizationPost-trainingReinforcement LearningMultimodal AIMachine LearningRankingRecommender Systems

AI 점수 100core

지원하기

Research Engineer/Scientist - Human Alignment, Consumer Devices

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림