openai

Researcher, Context - Agent Post-Training

AI·머신러닝연구·R&D

AI 요약

OpenAI의 Agent Post-Training 팀에서 차세대 AI 에이전트 모델의 컨텍스트 연산 스케일링을 담당할 Context Researcher를 채용합니다. RL, 데이터 파이프라인, 평가 시스템 등 포스트 트레이닝 스택 전반을 개선하고 모델 성능을 극대화하는 역할을 수행합니다.

주요 업무

- 컨텍스트 연산 스케일링 개선을 위한 실험 설계 및 실행 - RL, 데이터 파이프라인, 채점기, 보상 신호, 평가, 진단 및 모델 행동 분석을 포함한 포스트 트레이닝 스택의 엔드투엔드 개선 - 모델의 실패 사례를 발굴하는 평가 및 환경 구축, 이를 학습 데이터 및 제품 개선으로 연결 - Codex 및 ChatGPT 제품 팀과 협력하여 사용자 요구사항을 모델 개선에 반영 - 데이터 혼합, 목적 함수, 합성 데이터, 평가 루프 등 초기 학습 및 정렬 개입 작업 수행 - 대규모 학습 및 출시를 위한 시스템 기계장치(실험 속도, 신뢰성, 관측 가능성, 비용, 지연 시간 등) 개선 - 다중 에이전트 시스템 등 모델 학습, 제품 인프라를 아우르는 교차 기능 프로젝트 수행 - 출시되었거나 출시 예정인 모델의 심각한 실패 사례 디버깅 및 구체적인 가설 수립과 실험을 통한 해결

자격 요건

- 머신러닝, 소프트웨어 엔지니어링, 시스템, 통계학 또는 관련 분야의 강력한 기술적 기초 - LLM, RL, RLHF/RLAIF, 포스트 트레이닝, 평가(Evals), 채점기(Graders), 합성 데이터(Synthetic Data), 모델 학습, 코딩 에이전트, 도구 활용 에이전트 또는 프로덕션 ML 시스템에 대한 실무 경험 - 모호한 문제와 노이즈가 있는 신호 속에서 연구적 감각과 엔지니어링 실행력을 발휘할 수 있는 능력 - 벤치마크 점수뿐만 아니라 실제 제품 영향력과 모델 행동(유용성, 신뢰성, 정직성 등)을 중요하게 생각하는 태도 - 연구, 제품, 인프라, 데이터, 안전 등 다양한 부서와 원활하게 소통하고 협업할 수 있는 역량

기술 스택

LLMRLRLHFRLAIFMachine LearningCodexChatGPT

AI 점수 98core

지원하기

Researcher, Context - Agent Post-Training

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림