
openai
Researcher, Alignment Science
AI·머신러닝연구·R&D개발
AI 요약
OpenAI의 Alignment Science 팀에서 모델의 의도 정렬(Intent Alignment)과 안전성을 연구할 Research Engineer 및 Scientist를 채용합니다. LLM이 사용자의 의도를 정확히 파악하고 정직하게 답변하도록 강화학습 기반의 실험을 설계하고 모델을 학습시키는 것이 핵심입니다. Python과 PyTorch 숙련도, 대규모 모델 학습 경험이 필수적이며, 연구 성과를 실제 모델 배포에 적용하고 외부 논문으로 발표하는 역할을 수행합니다.
주요 업무
의도 정렬, 정직성, 보정 및 강건성에 초점을 맞춘 실험 설계 및 구현; 강화학습 및 기타 경험적 ML 방법을 사용한 모델 학습 및 평가; 환각, 보상 해킹, 은밀한 행동 등 실패 모드에 대한 평가 지표 개발; 모델의 자가 검증 및 정직한 보고를 장려하는 방법 연구; 정렬 방법의 스케일링 법칙 조사; 성공적인 기술을 모델 학습 및 배포 워크플로우에 통합; 외부 학술 논문 발표.
자격 요건
대규모 ML 모델(특히 LLM)의 학습, 평가 또는 디버깅에 대한 강력한 실무 경험; Python 및 PyTorch와 같은 현대적 ML 프레임워크에 대한 우수한 엔지니어링 기술; 수학적 엄밀함과 정량적 감각; 강화학습(RL), 사후 학습(Post-training), 선호도 최적화(Preference optimization), 확장 가능한 감독(Scalable oversight) 또는 모델 평가 경험; 높은 독립성과 협업 능력; 경쟁 프로그래밍이나 수학 경시 대회 등 기술적 문제 해결 능력.
기술 스택
PythonPyTorchLLMReinforcement LearningML FrameworksPost-trainingPreference optimization
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발B2B Marketing Lead, Korea
마케팅