openai

Software Engineer, RL Training Infra

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

OpenAI의 Post-Training Frontiers 팀에서 차세대 에이전트 모델(Codex, ChatGPT, o1 등)의 대규모 강화학습(RL) 트레이닝을 안정적이고 빠르게 유지할 제너럴리스트 엔지니어를 채용합니다. 분산 인프라, 오케스트레이션, 추론 병목 해결 등 연구와 엔지니어링 경계의 고난도 기술 문제를 해결하는 역할입니다.

주요 업무

- 대규모 RL 학습 실행 중 발생하는 긴급한 엔지니어링 및 인프라 문제 해결 - 학습 시스템, 추론, 오케스트레이션, 스케일링 및 분산 인프라 전반의 디버깅 - 실험 스케일링, 학습 안정성 개선, 분산 시스템 디버깅, 지연 시간 및 비용 절감 등 연구와 엔지니어링 경계의 기술적 난제 해결 - 멀티 에이전트 기능, 메모리 등 인프라 집약적 통합을 개발하는 연구원 지원 - 반복적인 운영 문제를 더 나은 도구, 시스템, 프로세스 또는 추상화로 전환 - 모델 동작, 학습 데이터, RL 시스템, 평가 인프라, 서빙 시스템 전반의 실패 요인 분석 및 개선

자격 요건

- ML 인프라 레이어 경험을 보유한 강력한 제너럴리스트 엔지니어 - 강화학습(RL), 추론, 스케일링, 학습 시스템, 오케스트레이션 또는 관련 ML 인프라 작업 경험 - 낯선 기술 레이어에서도 빠르게 학습하고 적응할 수 있는 능력 - 높은 주도성과 뛰어난 디버깅 및 커뮤니케이션 역량 [우대사항] - 대규모 모델 학습, 비동기 RL 시스템 또는 고처리량 ML 인프라 지원 경험 - GPU, 네트워킹, 오케스트레이션, 추론 스택 전반의 분산 시스템 디버깅 경험 - 성능 최적화, 스케일링 또는 프로덕션 크리티컬 인프라 배경지식 - 연구원 또는 빠르게 움직이는 모델 팀과의 직접적인 협업 경험

기술 스택

RL (Reinforcement Learning)ML InfrastructureDistributed SystemsGPUsOrchestrationInference

AI 점수 98core

지원하기

Software Engineer, RL Training Infra

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림