openai

Researcher, Alignment Oversight

AI·머신러닝연구·R&D개발

AI 요약

OpenAI의 Alignment Oversight 팀에서 AI 시스템의 제어와 정렬(Alignment)을 개선할 연구원을 채용합니다. LLM 훈련 및 평가 경험을 바탕으로 에이전트형 모델의 안전성을 확보하고, 실시간 모니터링 및 피드백 시스템을 설계하여 모델의 행동을 인간의 의도에 맞게 조정하는 역할을 수행합니다.

주요 업무

에이전트 AI 모델을 위한 정렬 실험 설계 및 구현; 액션 모니터링, 레드팀 및 인간 개입 제어 시스템 배포; 프론티어 모델의 정렬 실패 모드(과잉 의욕, 지시 불이행, 은밀한 행동, 스키밍 성향 등) 평가 개발; 배포 데이터 분석을 통한 모델 실패 및 감독 격차 파악; 감독 신호를 훈련에 반영하는 기술 개발; 외부 학술 연구 발표 및 타 팀(제품, 보안, 안전 등)과의 협업.

자격 요건

대규모 ML 모델(특히 LLM)의 훈련, 평가 및 디버깅에 대한 강력한 실무 경험; 강화학습(Reinforcement learning), Post-training, 선호도 최적화(Preference optimization), 확장 가능한 감독(Scalable oversight), 모델 평가(Model evaluation) 또는 인접한 경험적 ML 연구 경험; 모호한 연구 아이디어를 신뢰할 수 있는 실험, 도구, 훈련 파이프라인 및 프로덕션 시스템으로 전환할 수 있는 강력한 엔지니어링 실행력; 빠른 속도의 협업 연구 환경에 적응할 수 있는 능력; 안전과 유용성을 결합된 목표로 인식하는 태도.

기술 스택

LLMsReinforcement learningPost-trainingPreference optimizationScalable oversightModel evaluationML models

AI 점수 100core

지원하기

Researcher, Alignment Oversight

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림