
openai
Software Engineer, RL Training Infra
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
OpenAI의 Post-Training Frontiers 팀에서 차세대 에이전트 모델(Codex, ChatGPT, o1 등)의 대규모 강화학습(RL) 트레이닝을 안정적이고 빠르게 유지할 제너럴리스트 엔지니어를 채용합니다. 분산 인프라, 오케스트레이션, 추론 병목 해결 등 연구와 엔지니어링 경계의 고난도 기술 문제를 해결하는 역할입니다.
주요 업무
- 대규모 RL 학습 실행 중 발생하는 긴급한 엔지니어링 및 인프라 문제 해결
- 학습 시스템, 추론, 오케스트레이션, 스케일링 및 분산 인프라 전반의 디버깅
- 실험 스케일링, 학습 안정성 개선, 분산 시스템 디버깅, 지연 시간 및 비용 절감 등 연구와 엔지니어링 경계의 기술적 난제 해결
- 멀티 에이전트 기능, 메모리 등 인프라 집약적 통합을 개발하는 연구원 지원
- 반복적인 운영 문제를 더 나은 도구, 시스템, 프로세스 또는 추상화로 전환
- 모델 동작, 학습 데이터, RL 시스템, 평가 인프라, 서빙 시스템 전반의 실패 요인 분석 및 개선
자격 요건
- ML 인프라 레이어 경험을 보유한 강력한 제너럴리스트 엔지니어
- 강화학습(RL), 추론, 스케일링, 학습 시스템, 오케스트레이션 또는 관련 ML 인프라 작업 경험
- 낯선 기술 레이어에서도 빠르게 학습하고 적응할 수 있는 능력
- 높은 주도성과 뛰어난 디버깅 및 커뮤니케이션 역량
[우대사항]
- 대규모 모델 학습, 비동기 RL 시스템 또는 고처리량 ML 인프라 지원 경험
- GPU, 네트워킹, 오케스트레이션, 추론 스택 전반의 분산 시스템 디버깅 경험
- 성능 최적화, 스케일링 또는 프로덕션 크리티컬 인프라 배경지식
- 연구원 또는 빠르게 움직이는 모델 팀과의 직접적인 협업 경험
기술 스택
RL (Reinforcement Learning)ML InfrastructureDistributed SystemsGPUsOrchestrationInference
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발B2B Marketing Lead, Korea
마케팅Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Personality
AI·머신러닝, 연구·R&D