Jobs
openai 로고

openai

CPU/Storage/PoP-WAN Program Manager

인프라·DevOps하드웨어·임베디드제품·기획·디자인

AI 요약

OpenAI의 인프라 조직에서 글로벌 규모의 CPU, 스토리지, 네트워크(WAN/PoP) 확장을 주도할 기술 프로그램 매니저(TPM)를 채용합니다. 대규모 GPU 클러스터 활성화와 데이터 센터 운영을 총괄하며, 하드웨어 배포부터 전략적 용량 계획까지 인프라 실행 전반을 책임집니다.

주요 업무

글로벌 인프라 전반의 CPU/GPU 클러스터 활성화 프로그램 리드; 계약된 컴퓨팅 용량을 생산 클러스터로 전환하기 위한 준비 상태 주도; 신규 PoP, 백본 노드, WAN 확장 및 상호 연결 이니셔티브 배포 프로그램 소유; 조달, 물류, 설치, 네트워크 턴업, 테스트 및 핸드오버를 포함한 통합 일정 구축; BOM 준비, 서버 배송, 랙, 케이블링 및 벤더 마일스톤 조정; 학습 및 추론 워크로드를 지원하는 스토리지 시스템 배포 관리; 물리적 배포 실행(Rack-and-stack, 하드웨어 브링업, L1 검증 등) 리드; 반복 가능한 배포 플레이북 및 거버넌스 메커니즘 구축.

자격 요건

8년 이상의 기술 프로그램 관리, 인프라 배포, 네트워크 배포 또는 데이터 센터 운영 경험; 컴퓨트, 스토리지, 네트워킹 또는 대규모 인프라 시스템 전달 경험; 서버, 클러스터, 스토리지 어레이, 라우터, 스위치, 광학 장치 및 케이블링에 대한 실무 지식; 엔지니어링, 운영, 공급망 및 외부 벤더를 아우르는 교차 기능 프로그램 소유 경험; (우대) 하이퍼스케일러, 클라우드 제공업체, AI 인프라 기업 또는 글로벌 네트워크 운영사 근무 경험; (우대) GPU 클러스터, HPC 시스템 또는 대규모 학습 환경 배포 경험; (우대) 분산 스토리지 시스템 및 고성능 데이터 인프라에 대한 이해.

기술 스택

CPUGPUStorageWANPoPServersClustersRoutersSwitchesOpticsCablingAzureHPCDistributed storage systems
AI 점수 85ops

openai의 다른 공고

알림

알림이 없습니다