Jobs
openai 로고

openai

Head of Data Center Rack and Cluster

인프라·DevOps하드웨어·임베디드

AI 요약

OpenAI의 Industrial Compute 팀에서 차세대 AI 모델을 지원할 컴퓨트 인프라의 랙(Rack) 및 시스템 아키텍처를 정의하고 엔지니어링 팀을 이끌 리더를 채용합니다. 이 역할은 초기 아키텍처 정의부터 생산 준비 단계까지의 과정을 총괄하며, 하드웨어 벤더와의 협력 및 내부 팀 간의 조율을 담당합니다.

주요 업무

- 신규 OpenAI 컴퓨트 플랫폼을 위한 레퍼런스 랙, 클러스터 및 시스템 아키텍처 표준 정의 - 생산 단계로 전환되는 시스템의 준비 상태 및 인수 기준 정의 - 구성이 반복 가능하고 핸드오프 준비가 완료될 때까지 검증 프로세스 참여 - 가속기(Accelerator) 및 장비 벤더와의 관계 관리를 통한 전반적인 로드맵 정의 - 산업용 컴퓨트 및 파트너 팀과의 협력을 통한 요구사항 명확화 및 차세대 시스템의 원활한 인도 보장 - OpenAI의 미래 컴퓨트 플랫폼 정의, 테스트 및 안정화 작업을 수행하는 엔지니어링 리드 팀 관리

자격 요건

- 하이퍼스케일 데이터 센터(Hyperscale Data Center) 또는 이에 준하는 환경에서의 근무 경험 - 랙(Rack), 시스템 또는 네트워크 아키텍처 정의 분야의 깊은 경험 - 성능 및 TCO 모델링을 활용하여 비즈니스 리스크와 요구사항을 분석하고 복잡한 시스템 트레이드오프를 해결할 수 있는 능력 - 복잡한 신규 하드웨어 플랫폼의 인도 및 초기 인도부터 생산 준비 단계까지 시스템을 안정화한 경험 - 벤더 관계 관리를 통해 시스템 문제를 해결하고 OpenAI의 요구사항에 맞게 벤더 로드맵을 조율한 경험 - 우수한 팀 관리 및 리더십 역량

기술 스택

Rack ArchitectureSystem ArchitectureNetwork ArchitectureTCO ModelingHardware Validation
AI 점수 80

openai의 다른 공고

알림

알림이 없습니다