
openai
CPU/Storage/PoP-WAN Program Manager
인프라·DevOps하드웨어·임베디드제품·기획·디자인
AI 요약
OpenAI의 인프라 조직에서 글로벌 규모의 CPU, 스토리지, 네트워크(WAN/PoP) 확장을 주도할 기술 프로그램 매니저(TPM)를 채용합니다. 대규모 GPU 클러스터 활성화와 데이터 센터 운영을 총괄하며, 하드웨어 배포부터 전략적 용량 계획까지 인프라 실행 전반을 책임집니다.
주요 업무
글로벌 인프라 전반의 CPU/GPU 클러스터 활성화 프로그램 리드; 계약된 컴퓨팅 용량을 생산 클러스터로 전환하기 위한 준비 상태 주도; 신규 PoP, 백본 노드, WAN 확장 및 상호 연결 이니셔티브 배포 프로그램 소유; 조달, 물류, 설치, 네트워크 턴업, 테스트 및 핸드오버를 포함한 통합 일정 구축; BOM 준비, 서버 배송, 랙, 케이블링 및 벤더 마일스톤 조정; 학습 및 추론 워크로드를 지원하는 스토리지 시스템 배포 관리; 물리적 배포 실행(Rack-and-stack, 하드웨어 브링업, L1 검증 등) 리드; 반복 가능한 배포 플레이북 및 거버넌스 메커니즘 구축.
자격 요건
8년 이상의 기술 프로그램 관리, 인프라 배포, 네트워크 배포 또는 데이터 센터 운영 경험; 컴퓨트, 스토리지, 네트워킹 또는 대규모 인프라 시스템 전달 경험; 서버, 클러스터, 스토리지 어레이, 라우터, 스위치, 광학 장치 및 케이블링에 대한 실무 지식; 엔지니어링, 운영, 공급망 및 외부 벤더를 아우르는 교차 기능 프로그램 소유 경험; (우대) 하이퍼스케일러, 클라우드 제공업체, AI 인프라 기업 또는 글로벌 네트워크 운영사 근무 경험; (우대) GPU 클러스터, HPC 시스템 또는 대규모 학습 환경 배포 경험; (우대) 분산 스토리지 시스템 및 고성능 데이터 인프라에 대한 이해.
기술 스택
CPUGPUStorageWANPoPServersClustersRoutersSwitchesOpticsCablingAzureHPCDistributed storage systems
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발B2B Marketing Lead, Korea
마케팅