
xai
Software Engineer, Compute Infra
개발인프라·DevOpsAI·머신러닝
AI 요약
xAI의 Compute Infrastructure 팀에서 대규모 AI 학습 및 추론을 위한 차세대 클러스터와 오케스트레이션 플랫폼을 구축할 엔지니어를 채용합니다. C/C++, Rust 기반의 시스템 프로그래밍 역량과 Linux 커널 및 가상화 기술에 대한 깊은 이해를 바탕으로 엑사스케일급 컴퓨팅 자원을 최적화하는 역할을 수행합니다.
주요 업무
AI 워크로드의 학습 및 추론을 위한 대규모 클러스터 구축 및 관리, 기존 솔루션을 능가하는 자체 컨테이너 오케스트레이션 플랫폼 설계 및 개발, 연구팀과 협업하여 대규모 학습 및 실시간 애플리케이션을 위한 컴퓨팅 클러스터 최적화, 시스템 레벨의 성능 병목 현상 및 리소스 경합 문제 해결, 자동화 및 지속적 최적화를 통한 엔드투엔드 인프라 이니셔티브 주도
자격 요건
가상화 기술(KVM, Xen, QEMU) 및 고급 컨테이너화/샌드박싱(Kata, Firecracker, gVisor, Sysbox 등)에 대한 깊은 전문성, C/C++ 및 Rust 시스템 프로그래밍 숙련도, Linux 커널 내부(리소스 관리, 스케줄링, 메모리 관리 등)에 대한 깊은 지식 및 시스템 레벨 성능 최적화 경험, 대규모 분산 컴퓨팅 플랫폼 또는 고성능 인프라 구축 경험, (우대) Linux 커널 개발 경험, 대규모 AI 학습/추론 클러스터(GPU/TPU) 운영 및 설계 경험, 특화된 AI 컴퓨팅을 위한 커스텀 런타임 및 격리 기술 경험
기술 스택
CC++RustKVMXenQEMUKataFirecrackergVisorSysboxLinux KernelGPUTPUKubernetes
xai의 다른 공고
Human Resources Coordinator
경영지원Material Handler
현장운영Senior Data Engineer - Consumer Subscriptions
데이터Fiber Foreman
현장운영Member of Technical Staff
AI·머신러닝, 데이터, 인프라·DevOps, 연구·R&D, 개발Member of Technical Staff
개발, AI·머신러닝, 데이터, 인프라·DevOpsMember of Technical Staff
AI·머신러닝, 연구·R&D, 인프라·DevOpsSupervisor, Fiber
현장운영