
openai
Facilities Operations Manager
인프라·DevOps현장운영
AI 요약
OpenAI에서 차세대 대규모 AI 컴퓨팅 캠퍼스(Stargate)의 시운전, 운영 준비 및 장기 시설 관리를 담당할 Facilities Operations Manager를 채용합니다. 전기, 기계, 제어 및 냉각 시스템 등 미션 크리티컬 인프라의 안정적인 운영을 책임지는 역할입니다.
주요 업무
- AI 컴퓨팅 캠퍼스 전반의 미션 크리티컬 시설 인프라 일상 운영 리드
- 신규 캠퍼스 배포 및 인프라 확장을 지원하는 운영 준비 활동 주도
- 시운전 팀과 협력하여 시설을 건설/스타트업 단계에서 안정적인 상시 운영 상태로 전환
- 운영 절차, 유지보수 프로그램 및 비상 대응 계획 수립 및 지속적 개선
- 인프라 장애 대응 노력 리드 및 중요 이벤트 발생 시 복구 활동 조율
- 신뢰성 및 운영 성능 향상을 위한 근본 원인 분석(RCA) 조사 및 시정 조치 프로그램 추진
- 시설 운영을 지원하는 벤더, 계약업체 및 서비스 제공업체 관리
- 하드웨어 배포, 네트워킹 및 엔지니어링 팀과 협력하여 인프라 변경 및 유지보수 활동 조율
- 중요 시스템 전반의 시설 성능, 운영 리스크 및 용량 활용도 모니터링
- 시설 운영 인력의 채용, 교육 및 개발 지원 및 안전/환경 표준 준수 보장
자격 요건
- 미션 크리티컬 시설, 데이터 센터, 산업 인프라 또는 대규모 기술 운영 환경에서 8년 이상의 운영 경험
- 전기 배전 시스템, 발전기, UPS 시스템, 냉각 시스템 및 빌딩 제어 시스템에 대한 강력한 지식 보유
- 시운전(Commissioning), 운영 준비(Operational Readiness) 또는 인프라 인수인계 프로그램 지원 경험
- 시설 운영 팀, 계약업체 및 제3자 벤더 관리 경험
- 고압박의 운영 환경에서 장애에 대응하고 의사결정을 내릴 수 있는 능력
- 유지보수 전략, 운영 절차 및 신뢰성 프로그램 개발 경험
- [우대사항] 하이퍼스케일, 클라우드, AI, HPC 또는 미션 크리티컬 데이터 센터 환경 지원 경험
- [우대사항] 액체 냉각(Liquid Cooling) 시스템 및 고밀도 컴퓨팅 배포 경험
- [우대사항] 신뢰성 공학 방법론, 근본 원인 분석(RCA) 및 예방 보전 프로그램에 대한 이해
- [우대사항] 대규모 인프라 배포 프로그램 지원 및 여러 캠퍼스/지역에 걸친 운영 프로세스 확장 경험
기술 스택
UPSElectrical Distribution SystemsGeneratorsCooling SystemsBuilding ControlsLiquid Cooling Systems
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅