openai

Researcher, Agent Post-Training, API & Power-Users

AI·머신러닝연구·R&D개발

AI 요약

OpenAI의 Agent Post-Training 팀에서 API 사용자와 파워유저를 위한 에이전트 모델의 행동 개선을 담당하는 역할입니다. 실제 개발자 워크플로우 기반 평가 설계, 훈련 환경 구축, 실패 원인 분석, 데이터/평가/학습 개입을 통해 function calling, tool use, planning, instruction following, error recovery 등을 고도화합니다. 연구·엔지니어링·데이터·제품을 넘나드는 고난도 AI 모델 개선 업무입니다.

주요 업무

실제 API 및 파워유저 워크플로우에서 모델 행동 개선 실험 설계 및 실행, evals/grader/environment 구축, 모델 실패를 training data·behavior hypothesis·개선안으로 전환, API/product 신호를 post-training 개입으로 연결, tool use·planning·instruction following·error recovery·calibrated reasoning 개선, 모델 행동 프로젝트 end-to-end 소유, power-user traces/API usage 기반 피드백 루프 개발, major model runs 및 launch readiness 판단, shipped/near-shipped 모델의 hard failure 디버깅, data mixtures/objectives/synthetic data/eval loops 등 early-training 및 alignment 개입, 대규모 학습 및 출시를 위한 experiment velocity·reliability·observability·reproducibility·cost·latency 개선.

자격 요건

필수: ML, software engineering, systems, statistics, applied research 중 강한 기술적 기초 보유, LLMs/post-training/RL/RLHF/RLAIF/evals/graders/synthetic data/coding agents/tool-using agents/API products/production ML systems 경험 또는 이해, 모델 행동을 트레이스·평가 실패·API 상호작용으로부터 가설화할 수 있는 능력, 모호한 문제를 데이터·학습·평가·제품 개선으로 전환하는 역량, 연구·제품·인프라·데이터·평가·안전 경계를 넘나드는 협업 및 커뮤니케이션 능력. 우대: 개발자/전문 사용자 경험에 대한 높은 이해, agent harness 및 production-like environment에서의 작업 경험, 대규모 시스템/프로세스 구축 역량.

기술 스택

MLLLMpost-trainingRLRLHFRLAIFevalsgraderssynthetic datacoding agentstool-using agentsAPIPython

AI 점수 98core

지원하기

Researcher, Agent Post-Training, API & Power-Users

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림