openai

Agent Post-Training, API & Power Users

AI·머신러닝연구·R&D개발

AI 요약

OpenAI의 Agent Post-Training 팀에서 API 및 파워유저 대상 에이전트 모델의 성능·신뢰성·제품 적합성을 개선할 연구/엔지니어링 역할입니다. 실제 개발자 워크플로우 기반 평가와 학습 환경을 설계하고, 실패 원인을 데이터·평가·후처리 학습으로 연결해 모델 행동을 개선합니다. LLM, post-training, RLHF/RLAIF, evals 경험이 강하게 요구됩니다.

주요 업무

API 및 파워유저 워크플로우에서 모델 행동 개선 실험 설계 및 실행; real developer workflow 기반 evals, graders, environments 구축; 모델 실패를 training data, behavior hypothesis, shipped improvements로 전환; API/파워유저와 협업해 고가치 behavior gap 식별 및 post-training 개입 수행; 도구 사용 신뢰성, 개발자 의도 존중, 부분 실패 처리, clarification 요청, 멀티스텝 일관성 개선; 실패 분석부터 데이터 생성, 학습 실험, eval 설계, 통합, 출시 준비까지 end-to-end 프로젝트 수행; power-user traces, API usage patterns, production-like environment를 활용한 피드백 루프 구축; 대규모 학습/출시의 실험 속도, 신뢰성, 관측성, 재현성, 비용, latency, production readiness 개선; multi-agent systems 등 교차 기능 프로젝트 수행.

자격 요건

필수/우대 통합: ML, 소프트웨어 엔지니어링, 시스템, 통계 또는 응용연구에 대한 강한 기술적 기초; LLM, post-training, RL/RLHF/RLAIF, evals, graders, synthetic data, coding agents, tool-using agents, API products 또는 production ML systems의 실무 경험; 트랜스크립트/트레이스/eval 실패/API 상호작용을 보고 모델이 무엇을 배워야 하는지 가설을 세울 수 있는 능력; 모호하고 신호가 noisy한 문제를 데이터, 학습, 평가, 제품 변경으로 해결하는 역량; 연구·제품·인프라·데이터·evals·안전 경계를 넘나들며 협업하고 명확히 소통하는 능력; 개발자 및 expert-user 경험에 대한 높은 관심과 이해; 필요 시 화려하지 않더라도 시스템과 프로세스를 구축할 수 있는 태도.

기술 스택

LLMRLRLHFRLAIFevalsgraderssynthetic datacoding agentstool-using agentsAPIPython

AI 점수 98core

지원하기

Agent Post-Training, API & Power Users

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림