openai

Agent Post-Training Research

AI·머신러닝연구·R&D개발인프라·DevOps

AI 요약

OpenAI의 Agent Post-Training 팀에서 frontier agent 모델의 후학습(post-training) 연구·엔지니어링을 수행할 인재를 채용합니다. 코딩, 툴 사용, 컴퓨터 조작, 멀티에이전트 협업, 장기 과제 수행 등 에이전트 역량을 높이기 위한 실험 설계, 데이터·평가·보상신호 구축, 대규모 학습 인프라 개선, 제품 적용까지 폭넓게 담당합니다.

주요 업무

에이전트 모델의 행동을 개선하는 실험 설계 및 실행. RL, 데이터 파이프라인, grader, reward signal, eval, diagnostics, model-behavior analysis 등 post-training 스택 전반 개선. 실패 사례를 드러내는 eval과 환경 구축 후 이를 학습 데이터, 제품 수정, 연구 방향으로 전환. Codex/API/ChatGPT 제품팀과 협업하여 사용자 요구를 모델 개선으로 연결. 데이터 믹스, objective, synthetic data, eval loop 등 초기 학습·정렬 개입 수행. 대규모 학습/런칭의 속도, 신뢰성, 재현성, 비용, latency, production readiness 개선. 멀티에이전트 시스템 등 cross-functional 프로젝트 수행 및 shipped 모델의 hard failure 디버깅.

자격 요건

필수: 머신러닝, 소프트웨어 엔지니어링, 시스템, 통계 또는 관련 분야의 강한 기술적 기초와 빠른 학습 능력. LLM, RL, RLHF/RLAIF, post-training, evals, graders, synthetic data, model training, coding agents, tool-using agents, production ML systems 중 일부에 대한 실무 경험. 모호한 문제를 가설-실험-분석-의사결정으로 전환할 수 있는 능력. 연구, 제품, 인프라, 데이터, 평가, 안전 경계를 넘나들며 명확히 소통할 수 있는 역량. 우대/선호: 제품 임팩트와 모델 행동을 중시하고, 에이전트의 유용성·신뢰성·정직성·협업성을 중요하게 생각하는 태도. 대규모 학습 및 런칭 시스템을 구축하는 일을 즐기는 사람.

기술 스택

LLMRLRLHFRLAIFpost-trainingevalsgraderssynthetic datamodel trainingcoding agentstool-using agentsproduction ML systems

AI 점수 98core

지원하기

Agent Post-Training Research

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림