
cerebras
Python / PyTorch Developer — Frontend Inference Compiler – Dubai
AI 요약
Cerebras Systems는 GPU 대비 56배 큰 세계 최대 AI 칩을 개발하는 회사로, 단일 칩으로 수십 개의 GPU 성능을 제공하며 AI 학습 및 추론 속도를 혁신합니다. 특히 생성형 AI 추론 솔루션 분야에서 업계 최고 속도를 자랑하며, Mayo Clinic과의 파트너십 등 다양한 산업 분야에서 AI 애플리케이션 혁신을 주도하고 있습니다. 본 채용은 Cerebras의 독보적인 소프트웨어 및 하드웨어 조합을 통해 세계에서 가장 빠른 생성형 모델 추론을 개발하는 데 참여할 인재를 찾고 있습니다. 주요 업무는 최신 생성형 AI 모델 분석, 컴파일러 프론트엔드 인프라 개발, PyTorch FX/TorchScript/TorchDynamo 최적화, ML 및 컴파일러 팀과의 협업, 모델 최적화 연구 등입니다. Python, PyTorch 내부 구조, 계산 그래프, 컴파일러/인터프리터 경험이 필수이며, MLIR 기반 컴파일 스택, 하드웨어 가속기, 양자화 등에 대한 지식이 있으면 우대됩니다.
주요 업무
생성형 AI 분야의 새로운 모델 분석 및 컴파일 스택에 미치는 영향 이해, PyTorch 모델을 입력받아 중간 표현(IR)을 생성하는 프론트엔드 컴파일러 인프라 개발 및 유지보수, 그래프 캡처, 변환 및 분석을 위한 PyTorch FX / TorchScript / TorchDynamo 기반 도구 확장 및 최적화, ML 및 컴파일러 팀과의 협업을 통한 충실도 및 성능 일관성 확보, 기능 구현 전반에 걸친 타 팀과의 협업, Cerebras 추론 성능 향상을 위한 새로운 모델 최적화 방법 연구.
자격 요건
필수: 공학, 컴퓨터 과학 또는 이에 준하는 학위 및 뛰어난 능력 증거, 강력한 Python 프로그래밍 기술, PyTorch 내부 구조(TorchScript, FX, Dynamo 등)에 대한 깊이 있는 경험, 계산 그래프, 텐서 연산, 모델 추적에 대한 탄탄한 이해, 컴파일러, 인터프리터 또는 ML 그래프 최적화 프레임워크 구축/확장 경험, C++ 확장, LLVM, MLIR 또는 기타 IR 기반 컴파일러 인프라에 대한 친숙함, PyTorch 및 HuggingFace Transformers 라이브러리 작업 경험, 대규모 언어 모델(Transformer 아키텍처 변형, 생성 주기 등 이해)에 대한 지식 및 경험. 우대: MLIR 기반 컴파일 스택 지식, PyTorch, TensorFlow XLA, TVM, ONNX 또는 유사 컴파일러 스택 기여 경험, 하드웨어 가속기, 양자화 또는 런타임 스케줄링 지식, 다중 타겟 추론 컴파일 경험, 수치 정밀도 절충 및 연산자 내림 이해, 오픈소스 ML 컴파일러 프로젝트 기여 경험.
기술 스택
PythonPyTorchPyTorch FXTorchScriptTorchDynamoHuggingFace TransformersLLVMMLIRC++