Jobs
openai 로고

openai

Software Engineer, RL Training Infra

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

OpenAI의 Post-Training Frontiers 팀에서 차세대 에이전트 모델(Codex, ChatGPT, o1 등)의 대규모 강화학습(RL) 트레이닝을 안정적이고 빠르게 유지할 제너럴리스트 엔지니어를 채용합니다. 분산 인프라, 오케스트레이션, 추론 병목 해결 등 연구와 엔지니어링 경계의 고난도 기술 문제를 해결하는 역할입니다.

주요 업무

- 대규모 RL 학습 실행 중 발생하는 긴급한 엔지니어링 및 인프라 문제 해결 - 학습 시스템, 추론, 오케스트레이션, 스케일링 및 분산 인프라 전반의 디버깅 - 실험 스케일링, 학습 안정성 개선, 분산 시스템 디버깅, 지연 시간 및 비용 절감 등 연구와 엔지니어링 경계의 기술적 난제 해결 - 멀티 에이전트 기능, 메모리 등 인프라 집약적 통합을 개발하는 연구원 지원 - 반복적인 운영 문제를 더 나은 도구, 시스템, 프로세스 또는 추상화로 전환 - 모델 동작, 학습 데이터, RL 시스템, 평가 인프라, 서빙 시스템 전반의 실패 요인 분석 및 개선

자격 요건

- ML 인프라 레이어 경험을 보유한 강력한 제너럴리스트 엔지니어 - 강화학습(RL), 추론, 스케일링, 학습 시스템, 오케스트레이션 또는 관련 ML 인프라 작업 경험 - 낯선 기술 레이어에서도 빠르게 학습하고 적응할 수 있는 능력 - 높은 주도성과 뛰어난 디버깅 및 커뮤니케이션 역량 [우대사항] - 대규모 모델 학습, 비동기 RL 시스템 또는 고처리량 ML 인프라 지원 경험 - GPU, 네트워킹, 오케스트레이션, 추론 스택 전반의 분산 시스템 디버깅 경험 - 성능 최적화, 스케일링 또는 프로덕션 크리티컬 인프라 배경지식 - 연구원 또는 빠르게 움직이는 모델 팀과의 직접적인 협업 경험

기술 스택

RL (Reinforcement Learning)ML InfrastructureDistributed SystemsGPUsOrchestrationInference
AI 점수 98core

openai의 다른 공고

알림

알림이 없습니다