Jobs
xai 로고

xai

AI Engineer & Researcher - Inference

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

xAI에서 모델 추론(Inference) 최적화 및 대규모 서빙 시스템 구축을 담당할 엔지니어를 채용합니다. Python, Rust, CUDA 등을 활용하여 지연 시간 단축과 처리량 향상을 목표로 하며, SGLang과 같은 오픈소스 프로젝트 기여 및 최첨단 AI 인프라 구축에 참여하게 됩니다.

주요 업무

모델 추론의 지연 시간(Latency) 및 처리량(Throughput) 최적화, 수백만 사용자를 위한 안정적인 프로덕션 서빙 시스템 구축, 테스트 시간 연산(Test-time compute) 스케일링 연구 가속화, SGLang 등 오픈소스 추론 엔진 개발 및 기여.

자격 요건

모델 서빙 시스템 최적화(배칭, 캐싱, 로드 밸런싱, 모델 병렬화) 경험, GPU 커널 및 코드 생성 등 저수준 최적화 경험, 양자화·증류·투기적 디코딩 등 알고리즘 최적화 경험, 대규모 고동시성 프로덕션 서빙 경험, 추론 서비스의 테스트·벤치마킹·신뢰성 확보 경험, 뛰어난 의사소통 및 지식 공유 능력, Python/Rust 및 PyTorch/JAX 숙련도.

기술 스택

PythonRustPyTorchJAXCUDACUTLASSTritonNCCLKubernetesSGLang
AI 점수 100core

xai의 다른 공고

알림

알림이 없습니다