
openai
Researcher, Computer Use - Agent Post-Training
AI·머신러닝개발연구·R&D
AI 요약
OpenAI의 Agent Post-Training(Computer Use) 팀에서 브라우저 및 데스크톱 제어 등 컴퓨터 활용 능력을 갖춘 차세대 AI 에이전트 모델을 훈련하고 사후 학습(Post-Training) 스택을 개선할 엔지니어 및 연구원을 채용합니다.
주요 업무
- 데스크톱 및 브라우저를 포함한 복잡한 컴퓨터 사용 환경에서 에이전트 모델의 행동을 개선하기 위한 실험 설계 및 실행
- RL, 데이터 파이프라인, 채점기, 보상 신호, 평가, 진단 및 모델 행동 분석을 포함한 사후 학습(Post-Training) 스택의 엔드투엔드 개선
- 모델의 실패 사례를 파악하기 위한 평가 및 환경 구축, 이를 학습 데이터 및 제품 개선으로 전환
- Codex 및 ChatGPT 제품 팀과 협력하여 사용자 요구사항을 모델 개선에 반영
- 데이터 믹스, 목적 함수, 합성 데이터, 평가 루프 등 초기 학습 및 정렬(Alignment) 개입 작업 수행
- 대규모 학습 및 출시를 위한 시스템(실험 속도, 신뢰성, 관측 가능성, 재현성, 비용, 지연 시간 등) 개선
- 다중 에이전트 시스템 구축 및 프로덕션 유사 환경에서의 직접 학습 등 교차 기능 프로젝트 수행
자격 요건
- 머신러닝, 소프트웨어 엔지니어링, 시스템, 통계 또는 관련 분야의 탄탄한 기술적 기초
- LLM, RL(강화학습), RLHF/RLAIF, 사후 학습(Post-Training), 평가(Evals), 채점기(Graders), 합성 데이터, 모델 학습, 코딩 에이전트, 도구 사용 에이전트 또는 프로덕션 ML 시스템에 대한 실무 경험
- 모호하고 신호가 불분명한 개방형 문제를 해결하고 연구적 감각과 엔지니어링 실행력을 동시에 발휘할 수 있는 능력
- 벤치마크 점수뿐만 아니라 실제 제품 영향력과 모델의 유용성, 신뢰성, 정직성에 대한 관심
- 연구, 제품, 인프라, 데이터, 안전 등 다양한 부서와 원활하게 소통하고 협업할 수 있는 역량
기술 스택
LLMRLRLHFRLAIFMachine LearningSoftware EngineeringSystemsCodexChatGPT
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발B2B Marketing Lead, Korea
마케팅