
cerebras
Manager, Kernel Software
AI 요약
Cerebras Systems는 GPU 대비 56배 큰 세계 최대 AI 칩을 개발하는 회사로, 단일 칩으로 수십 개의 GPU 성능을 제공하며 AI 학습 및 추론 속도를 혁신합니다. 이번 채용은 고성능 AI 및 HPC 워크로드를 위한 하드웨어와 소프트웨어의 교차점에서 팀을 이끌어갈 Kernel Software Manager를 모집합니다. 딥러닝 연산 설계 및 최적화, 고성능 커널 라이브러리 개발, 팀 멘토링 및 성장을 지원하는 역할을 수행합니다. C++, Python 숙련도와 저수준 시스템 프로그래밍 경험이 필수이며, 병렬 알고리즘, 분산 메모리 시스템, GPU/FPGA 경험자는 우대합니다.
주요 업무
Cerebras WSE를 위한 고성능 ML 및 선형 대수 커널 설계 및 개발 (병렬 프로그래밍 기법 활용), 어셈블리 및 도메인 특화 C 유사 언어로 최적화된 저수준 루틴을 구축하는 팀 지도, 성능 모델링을 활용한 설계 및 최적화 결정, 커널 라이브러리의 정확성 및 성능 보장을 위한 테스트 개발 주도, 새로운 ML 모델 및 워크로드를 지원하기 위한 커널 아키텍처 발전, 미래 시스템 설계를 위한 하드웨어 아키텍트와의 협업, 엔지니어 멘토링 및 고성능, 협업적인 팀 문화 조성.
자격 요건
필수: 컴퓨터 과학, 컴퓨터 공학, 수학 또는 관련 분야 학사 학위 이상, 기술 팀 리딩 경험 (멘토링, 기술 방향 설정, 실행 주도), 하드웨어 아키텍처 개념에 대한 강한 이해 및 새로운 시스템 아키텍처 탐구 의지, C++ 및 Python 숙련도, 저수준 시스템 프로그래밍 경험, 라이브러리/API 개발 모범 사례 및 성능 최적화에 대한 이해, 복잡하고 계층적인 소프트웨어 스택 전반에 걸친 뛰어난 디버깅 능력.
우대: 커널 개발, 성능 최적화 또는 저수준 시스템 프로그래밍 팀 리딩 경험, 병렬 알고리즘 및 분산 메모리 시스템에 대한 탄탄한 배경, GPU, FPGA 또는 기타 맞춤형 하드웨어와 같은 가속기에 대한 실무 경험, 머신러닝 워크로드 및 TensorFlow, PyTorch와 같은 프레임워크에 대한 이해, 최신 아키텍처에서 HPC 커널 및 최적화 전략에 대한 이해.
기술 스택
C++PythonAssemblyTensorFlowPyTorch