openai

Inference Technical Lead, On-Device Transformers

AI·머신러닝연구·R&D하드웨어·임베디드개발

AI 요약

OpenAI의 Future of Computing Research 팀에서 온디바이스 및 엣지 배포를 위한 하드웨어 가속기 평가와 저수준 추론 스택 개발을 이끌 Technical Lead를 채용합니다. 세계적인 ML 연구진과 협력하여 모델 아키텍처를 최적화하고 고성능 컴퓨팅 시스템을 구축하는 역할입니다.

주요 업무

온디바이스 및 엣지 배포를 위한 실리콘 플랫폼(GPU, NPU, 가속기) 평가 및 선택, 연구팀과 협력하여 실제 배포 제약 조건(지연시간, 메모리, 전력 등)을 충족하는 모델 아키텍처 공동 설계, 시스템 성능 분석 및 모델 설계·하드웨어 역량 간의 트레이드오프 식별, 하드웨어 벤더 및 내부 인프라 팀과 협력하여 새로운 가속기 도입 및 트랜스포머 워크로드 실행 최적화, 커널 개발 및 런타임 시스템을 포함한 저수준 추론 스택 개발 팀 구축 및 리딩.

자격 요건

GPU, NPU 또는 기타 전용 가속기에서 워크로드를 평가하거나 배포한 경험, 트랜스포머 모델의 성능 특성(Attention, KV-cache 동작, 메모리 대역폭 요구사항 등)에 대한 이해, 추론 엔진·분산 런타임·하드웨어 인식 ML 파이프라인 등 고성능 컴퓨팅 시스템 설계 및 최적화 경험, CUDA 커널·컴파일러·ML 런타임 등 저수준 성능 크리티컬 소프트웨어 개발 및 팀 리딩 경험, 모델 학습 및 인지 관련 실무 경험.

기술 스택

GPUNPUCUDATransformerKV-cacheML RuntimesCompilersKernelsInference Engines

AI 점수 100core

지원하기

Inference Technical Lead, On-Device Transformers

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림