openai

Researcher, Connectors - Agent Post-Training

개발AI·머신러닝연구·R&D

AI 요약

OpenAI의 Agent Post-Training(Connectors) 팀에서 프론티어 에이전트 모델을 학습시키고 고도화할 엔지니어를 채용합니다. 이 역할은 모델이 Slack, GitHub 등 주요 업무용 소프트웨어 및 API와 코드를 통해 상호작용할 수 있도록 훈련시키는 업무를 담당합니다. 강화학습(RL), 데이터 파이프라인, 평가 시스템 구축 등을 통해 에이전트의 성능을 극대화합니다.

주요 업무

- 복잡한 소프트웨어 및 플러그인에 대한 에이전트 모델 행동을 개선하기 위한 실험 설계 및 실행 - RL, 데이터 파이프라인, 채점기, 보상 신호, 평가(Evals), 진단 및 모델 행동 분석을 포함한 포스트 트레이닝 스택의 엔드투엔드 개선 주도 - 모델의 실패 사례를 포착하는 평가 및 환경을 구축하고, 이를 학습 데이터, 제품 수정 또는 새로운 연구 방향으로 전환 - Codex 및 ChatGPT 제품 팀과 협업하여 사용자 요구사항을 파악하고 제품 신호를 모델 개선에 반영 - 데이터 혼합, 목표 설정, 합성 데이터 및 평가 루프를 포함한 초기 학습 및 정렬(Alignment) 개입 작업 수행 - 대규모 학습 및 출시를 위한 시스템(실험 속도, 신뢰성, 관측 가능성, 재현성, 비용, 지연 시간 등) 개선 - 멀티 에이전트 시스템 구축 또는 프로덕션 유사 환경에서의 직접 학습 등 교차 기능 프로젝트 수행

자격 요건

- 머신러닝, 소프트웨어 엔지니어링, 시스템, 통계 또는 관련 분야의 강력한 기술적 기초 역량 - LLM, RL(강화학습), RLHF/RLAIF, 포스트 트레이닝(Post-training), 평가(Evals), 채점기(Graders), 합성 데이터(Synthetic data), 모델 학습, 코딩 에이전트, 도구 활용 에이전트 또는 프로덕션 ML 시스템에 대한 실무 경험 - 모호하고 신호가 불분명한 미해결 문제에 대해 연구적 감각과 엔지니어링 실행력을 발휘할 수 있는 능력 - 벤치마크 점수 향상뿐만 아니라 실제 제품 임팩트와 모델의 유용성, 신뢰성, 정직성에 기여하고자 하는 열정 - 다기능 팀(연구, 제품, 인프라, 데이터, 안전 등)과 원활하게 소통하고 협업할 수 있는 능력

기술 스택

LLMRLRLHFRLAIFAPIsCodexChatGPT

AI 점수 98core

지원하기

Researcher, Connectors - Agent Post-Training

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림