cerebras

Senior Runtime Engineer

AI 요약

Cerebras Systems는 GPU 대비 56배 큰 세계 최대 AI 칩을 개발하는 회사로, 단일 칩으로 수십 개의 GPU 성능을 제공하며 AI 학습 및 추론 속도를 혁신합니다. 차세대 대규모 AI 학습 시스템 구축을 위한 고성능 분산 소프트웨어 엔지니어를 채용합니다. 이 직무는 대규모 컴퓨팅 및 데이터 파이프라인을 오케스트레이션하고, 수조 개의 매개변수를 가진 모델의 효율적인 실행을 지원하며, 시스템 엔지니어링과 머신러닝 성능의 교차점에서 일하게 됩니다. C/C++ 기반의 고성능 분산 시스템 개발 경험과 머신러닝 관련 지식이 요구됩니다.

주요 업무

대규모 모델 학습, 미세 조정, 강화 학습 워크로드를 위한 고성능 분산 소프트웨어 설계 및 구현, 대규모 컴퓨팅 및 데이터 파이프라인을 이기종 클러스터 전반에 걸쳐 오케스트레이션, 수조 개의 매개변수를 가진 모델의 효율적인 실행 지원, 동시성, 처리량 및 확장성의 한계 극복, 데이터 수집부터 분산 실행까지 모델 학습 및 최적화 전반 담당, ML 및 컴파일러 팀과의 협업을 통한 새로운 모델 아키텍처, 학습 방식, 하드웨어별 최적화 통합, 프로파일링 및 계측 도구를 사용한 복잡한 성능 문제 진단 및 해결, 시스템 설계, 아키텍처 검토, 로드맵 계획 기여.

자격 요건

필수: 3년 이상의 고성능 또는 분산 시스템 소프트웨어 개발 경험, C/C++ 프로그래밍 능력 (멀티스레딩, 메모리 관리, 성능 최적화 전문성), 분산 시스템, 네트워킹 또는 프로세스 간 통신 경험, 데이터 구조, 동시성, 시스템 수준 리소스 관리(CPU, I/O, 메모리)에 대한 이해, 스레드부터 클러스터까지 규모에 따른 코드 디버깅, 프로파일링, 최적화 능력, 컴퓨터 과학, 전기 공학 또는 관련 분야 학사, 석사 또는 이에 준하는 경험. 우대: 머신러닝 학습 또는 추론 파이프라인(특히 분산 학습 및 대규모 모델 확장) 경험, Python 및 PyTorch 경험(모델 학습 또는 성능 튜닝 맥락), 컴파일러 내부, 사용자 정의 하드웨어 인터페이스 또는 저수준 프로토콜 설계 경험, 고성능 클러스터, HPC 시스템 또는 사용자 정의 하드웨어/소프트웨어 공동 설계 경험, 대규모 AI 워크로드 성능 향상에 대한 깊은 호기심.

기술 스택

C/C++PythonPyTorch

지원하기

Senior Runtime Engineer

AI 요약

주요 업무

자격 요건

기술 스택

cerebras의 다른 공고

알림