
openai
Facilities Operations Lead - Stargate
인프라·DevOps현장운영
AI 요약
OpenAI에서 차세대 AI 데이터 센터의 시운전, 배포 및 장기 운영을 총괄할 Facilities Operations Lead를 채용합니다. 10년 이상의 대규모 데이터 센터 운영 경험과 액체 냉각 시스템에 대한 전문성을 바탕으로 AI 인프라의 물리적 기반을 구축하고 관리하는 역할을 수행합니다.
주요 업무
미션 크리티컬 데이터 센터 시설의 운영 시퀀스, 시운전 단계 및 브링업(bring-up) 프로세스 정의 및 실행. 데이터 센터 및 하드웨어 구성에 맞춤화된 배포 절차 정의를 위해 설계 및 하드웨어 팀과 협업. 대규모 데이터 센터 캠퍼스의 설치, 시운전 및 운영 준비 상태 감독. 고성능 액체 냉각 시스템을 포함한 데이터 센터 인프라의 모니터링, 유지보수 및 품질 관리. 현장 운영 인력 배치 전략 수립. 계획된/예기치 않은 다운타임에 대한 절차 및 크리티컬 시설 구성 요소에 대한 SLA 수립 및 시행.
자격 요건
10년 이상의 대규모 데이터 센터 시설 운영, 시운전 또는 크리티컬 인프라 엔지니어링 경험. CDU 및 인랙(in-rack)/인로우(in-row) 매니폴드 설계를 포함한 액체 냉각 IT 시스템에 대한 깊은 이해. 건설, 하드웨어, 운영의 접점에서 인프라 프로세스를 정의하고 개선하는 능력. 배포부터 장기 유지보수 및 장애 복구까지 인프라 소유권을 가질 수 있는 역량. 운영 프로세스를 통한 신뢰성 관리 및 현장 이슈 대응 경험.
기술 스택
Liquid CoolingCDU (Cooling Distribution Unit)In-rack/In-row ManifoldData Center InfrastructureSLACommissioning
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발B2B Marketing Lead, Korea
마케팅Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발