
openai
Head of Data Center Rack and Cluster
인프라·DevOps하드웨어·임베디드
AI 요약
OpenAI의 Industrial Compute 팀에서 차세대 AI 모델을 지원할 컴퓨트 인프라의 랙(Rack) 및 시스템 아키텍처를 정의하고 엔지니어링 팀을 이끌 리더를 채용합니다. 이 역할은 초기 아키텍처 정의부터 생산 준비 단계까지의 과정을 총괄하며, 하드웨어 벤더와의 협력 및 내부 팀 간의 조율을 담당합니다.
주요 업무
- 신규 OpenAI 컴퓨트 플랫폼을 위한 레퍼런스 랙, 클러스터 및 시스템 아키텍처 표준 정의
- 생산 단계로 전환되는 시스템의 준비 상태 및 인수 기준 정의
- 구성이 반복 가능하고 핸드오프 준비가 완료될 때까지 검증 프로세스 참여
- 가속기(Accelerator) 및 장비 벤더와의 관계 관리를 통한 전반적인 로드맵 정의
- 산업용 컴퓨트 및 파트너 팀과의 협력을 통한 요구사항 명확화 및 차세대 시스템의 원활한 인도 보장
- OpenAI의 미래 컴퓨트 플랫폼 정의, 테스트 및 안정화 작업을 수행하는 엔지니어링 리드 팀 관리
자격 요건
- 하이퍼스케일 데이터 센터(Hyperscale Data Center) 또는 이에 준하는 환경에서의 근무 경험
- 랙(Rack), 시스템 또는 네트워크 아키텍처 정의 분야의 깊은 경험
- 성능 및 TCO 모델링을 활용하여 비즈니스 리스크와 요구사항을 분석하고 복잡한 시스템 트레이드오프를 해결할 수 있는 능력
- 복잡한 신규 하드웨어 플랫폼의 인도 및 초기 인도부터 생산 준비 단계까지 시스템을 안정화한 경험
- 벤더 관계 관리를 통해 시스템 문제를 해결하고 OpenAI의 요구사항에 맞게 벤더 로드맵을 조율한 경험
- 우수한 팀 관리 및 리더십 역량
기술 스택
Rack ArchitectureSystem ArchitectureNetwork ArchitectureTCO ModelingHardware Validation
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅