
openai
Researcher, Alignment Training
AI·머신러닝연구·R&D개발
AI 요약
OpenAI의 Alignment Training 팀에서 프론티어 모델의 행동 성향을 연구하고 조정할 시니어 연구원을 채용합니다. 프리트레이닝부터 포스트트레이닝까지 전 과정에서 모델이 의도를 이해하고 정직하며 신뢰할 수 있도록 학습시키는 데이터 방법론과 평가 루프를 구축하는 것이 핵심입니다. 대규모 머신러닝 및 실험 설계 역량이 필수적입니다.
주요 업무
모델의 의도 이해 및 추론 능력을 가르치는 합성 데이터 방법론 개발, 학습 단계별(Pre/Mid/Post-training) 개입 효과 연구 및 최적의 개입 시점 결정, 모델 행동과 학습 목표를 연결하는 평가 루프 구축, 재사용 가능한 데이터 생성 및 필터링 파이프라인 설계, 학습된 행동과 벤치마크 이득을 구분하는 실험 수행, 유관 팀(프리트레이닝, 포스트트레이닝, 제품 등)과의 협업을 통한 연구 인사이트 적용, 정렬 학습(Alignment Training) 연구 아젠다 정의 지원.
자격 요건
대규모 머신러닝(특히 프리트레이닝, 포스트트레이닝, 합성 데이터, 모델 평가, 학습 인프라) 분야의 탁월한 기술적 업적 보유자, 모호하거나 노이즈가 있는 신호에서도 실험을 설계할 수 있는 능력, 연구적 가설 수립과 엔지니어링 실행(파이프라인 구축 및 실험) 간의 유연한 전환 능력, 연구 질문의 우선순위를 정하는 뛰어난 판단력, 모델의 유용성·정직성·신뢰성 향상에 대한 열정, 연구·엔지니어링·제품 컨텍스트 전반에서의 명확한 커뮤니케이션 능력, 실험에 기반한 실용적이고 증거 중심적인 업무 선호.
기술 스택
Large-scale MLSynthetic DataModel EvaluationTraining InfrastructureLLMPre-trainingPost-trainingPythonPyTorch
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅