Jobs
openai 로고

openai

Facilities Operations Manager

인프라·DevOps현장운영

AI 요약

OpenAI에서 차세대 대규모 AI 컴퓨팅 캠퍼스(Stargate)의 시운전, 운영 준비 및 장기 시설 관리를 담당할 Facilities Operations Manager를 채용합니다. 전기, 기계, 제어 및 냉각 시스템 등 미션 크리티컬 인프라의 안정적인 운영을 책임지는 역할입니다.

주요 업무

- AI 컴퓨팅 캠퍼스 전반의 미션 크리티컬 시설 인프라 일상 운영 리드 - 신규 캠퍼스 배포 및 인프라 확장을 지원하는 운영 준비 활동 주도 - 시운전 팀과 협력하여 시설을 건설/스타트업 단계에서 안정적인 상시 운영 상태로 전환 - 운영 절차, 유지보수 프로그램 및 비상 대응 계획 수립 및 지속적 개선 - 인프라 장애 대응 노력 리드 및 중요 이벤트 발생 시 복구 활동 조율 - 신뢰성 및 운영 성능 향상을 위한 근본 원인 분석(RCA) 조사 및 시정 조치 프로그램 추진 - 시설 운영을 지원하는 벤더, 계약업체 및 서비스 제공업체 관리 - 하드웨어 배포, 네트워킹 및 엔지니어링 팀과 협력하여 인프라 변경 및 유지보수 활동 조율 - 중요 시스템 전반의 시설 성능, 운영 리스크 및 용량 활용도 모니터링 - 시설 운영 인력의 채용, 교육 및 개발 지원 및 안전/환경 표준 준수 보장

자격 요건

- 미션 크리티컬 시설, 데이터 센터, 산업 인프라 또는 대규모 기술 운영 환경에서 8년 이상의 운영 경험 - 전기 배전 시스템, 발전기, UPS 시스템, 냉각 시스템 및 빌딩 제어 시스템에 대한 강력한 지식 보유 - 시운전(Commissioning), 운영 준비(Operational Readiness) 또는 인프라 인수인계 프로그램 지원 경험 - 시설 운영 팀, 계약업체 및 제3자 벤더 관리 경험 - 고압박의 운영 환경에서 장애에 대응하고 의사결정을 내릴 수 있는 능력 - 유지보수 전략, 운영 절차 및 신뢰성 프로그램 개발 경험 - [우대사항] 하이퍼스케일, 클라우드, AI, HPC 또는 미션 크리티컬 데이터 센터 환경 지원 경험 - [우대사항] 액체 냉각(Liquid Cooling) 시스템 및 고밀도 컴퓨팅 배포 경험 - [우대사항] 신뢰성 공학 방법론, 근본 원인 분석(RCA) 및 예방 보전 프로그램에 대한 이해 - [우대사항] 대규모 인프라 배포 프로그램 지원 및 여러 캠퍼스/지역에 걸친 운영 프로세스 확장 경험

기술 스택

UPSElectrical Distribution SystemsGeneratorsCooling SystemsBuilding ControlsLiquid Cooling Systems
AI 점수 10none

openai의 다른 공고

알림

알림이 없습니다