openai

Researcher, Alignment Science

AI·머신러닝연구·R&D개발

AI 요약

OpenAI의 Alignment Science 팀에서 모델의 의도 정렬(Intent Alignment)과 안전성을 연구할 Research Engineer 및 Scientist를 채용합니다. LLM이 사용자의 의도를 정확히 파악하고 정직하게 답변하도록 강화학습 기반의 실험을 설계하고 모델을 학습시키는 것이 핵심입니다. Python과 PyTorch 숙련도, 대규모 모델 학습 경험이 필수적이며, 연구 성과를 실제 모델 배포에 적용하고 외부 논문으로 발표하는 역할을 수행합니다.

주요 업무

의도 정렬, 정직성, 보정 및 강건성에 초점을 맞춘 실험 설계 및 구현; 강화학습 및 기타 경험적 ML 방법을 사용한 모델 학습 및 평가; 환각, 보상 해킹, 은밀한 행동 등 실패 모드에 대한 평가 지표 개발; 모델의 자가 검증 및 정직한 보고를 장려하는 방법 연구; 정렬 방법의 스케일링 법칙 조사; 성공적인 기술을 모델 학습 및 배포 워크플로우에 통합; 외부 학술 논문 발표.

자격 요건

대규모 ML 모델(특히 LLM)의 학습, 평가 또는 디버깅에 대한 강력한 실무 경험; Python 및 PyTorch와 같은 현대적 ML 프레임워크에 대한 우수한 엔지니어링 기술; 수학적 엄밀함과 정량적 감각; 강화학습(RL), 사후 학습(Post-training), 선호도 최적화(Preference optimization), 확장 가능한 감독(Scalable oversight) 또는 모델 평가 경험; 높은 독립성과 협업 능력; 경쟁 프로그래밍이나 수학 경시 대회 등 기술적 문제 해결 능력.

기술 스택

PythonPyTorchLLMReinforcement LearningML FrameworksPost-trainingPreference optimization

AI 점수 100core

지원하기

Researcher, Alignment Science

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림