
rebellions
Collective Communication Library Engineer (Software)
개발
AI 요약
NPU의 아키텍처·토폴로지에 최적화된 집단 통신(collective communication) 라이브러리 설계 및 구현을 담당하는 시스템 소프트웨어 엔지니어 채용 공고입니다. API 정의, 성능 최적화, 하드웨어·소프트웨어 팀과 협업하여 성능 병목 분석 및 향후 NPU·인터커넥트 아키텍처 방향에 영향력을 행사하는 역할입니다.
주요 업무
NPU 전용 아키텍처·토폴로지에 맞춘 집단 통신 라이브러리의 핵심 컴포넌트 설계 및 구현; 통신 라이브러리의 기술 설계, API 정의 및 성능 최적화; 하드웨어 및 소프트웨어 팀과 협업하여 성능 병목 분석 및 향후 NPU·인터커넥트 아키텍처에 영향 제공.
자격 요건
석사 학위(컴퓨터공학·컴퓨터공학 관련 전공) 이상; 고성능 시스템 소프트웨어 개발 경력 최소 5년; 집단 통신 알고리즘(All-Reduce, All-Gather, Reduce-Scatter 등)에 대한 이해; 저수준 시스템 프로그래밍(C/C++) 능숙; OS 내부 구조 및 RDMA/RoCE 등 네트워킹 패브릭 이해; 인터커넥트 토폴로지 및 NoC(Network-on-Chip) 아키텍처 이해; 복잡하고 고성능인 신뢰성 있는 소프트웨어 개발 경험. 우대: HPC·병렬컴퓨팅·컴퓨터구조 관련 박사학위; NCCL, MPI 등 고성능 통신 라이브러리 기여 경험; GPU/TPU/기타 NPU의 성능 분석 및 최적화 경험 (NVLink, CXL, RoCE 등 인터커넥트 경험).
기술 스택
CC++OS internalsRDMARoCENCCLMPINetwork-on-ChipNoC인터커넥트 아키텍처성능 분석/최적화NPU/GPU/TPU 기반 가속기