
openai
Hardware Operations Technical Program Manager
하드웨어·임베디드인프라·DevOps제품·기획·디자인현장운영
AI 요약
OpenAI의 Stargate 팀에서 대규모 AI 시스템을 위한 물리적 인프라 구축 및 하드웨어 운영을 총괄할 Technical Program Manager(TPM)를 채용합니다. 서버, 랙, 네트워크 등 하드웨어의 설계부터 배포, 유지보수까지 전 과정을 관리하며 AI 인프라의 안정성과 확장성을 책임지는 핵심적인 역할입니다.
주요 업무
AI 인프라 하드웨어 운영 준비 프로그램 주도; 배포, 수리, 진단 등 운영 프로세스 표준화 및 지원 모델 개발; 하드웨어 엔지니어링, 제조, 공급망, 데이터 센터 운영팀 간의 협업 조율; 하드웨어 운영 상태 및 효율성 측정을 위한 스코어카드 및 알고리즘 개발; 리스크 식별 및 완화 전략 수립; 하드웨어 배포 및 운영 중 발생하는 이슈 해결 주도 및 프로세스 개선.
자격 요건
7년 이상의 기술 프로그램 관리(TPM), 하드웨어 운영, 제조 운영, 인프라 배포 또는 관련 기술 실행 분야 경력; 서버, 랙, 네트워킹 하드웨어 및 데이터 센터 인프라 지원 경험; NPI(신제품 도입), 제조 램프업, 물류, 설치 및 검증 등 하드웨어 개발/배포 라이프사이클에 대한 깊은 이해; 복잡한 일정 및 리스크 관리 능력; 공학, 컴퓨터 과학, 운영 또는 공급망 관련 학사 학위 또는 그에 준하는 실무 경험. (우대사항: GPU/가속기 인프라 경험, 하이퍼스케일 클라우드 환경 경험, 전력/냉각/케이블링 등 인프라 제약 사항에 대한 이해)
기술 스택
GPUAcceleratorServerRack IntegrationNetworkingPower/CoolingNPIInfrastructure DeploymentSupply Chain Management
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅