
openai
Inference Technical Lead, On-Device Transformers
AI·머신러닝연구·R&D하드웨어·임베디드개발
AI 요약
OpenAI의 Future of Computing Research 팀에서 온디바이스 및 엣지 배포를 위한 하드웨어 가속기 평가와 저수준 추론 스택 개발을 이끌 Technical Lead를 채용합니다. 세계적인 ML 연구진과 협력하여 모델 아키텍처를 최적화하고 고성능 컴퓨팅 시스템을 구축하는 역할입니다.
주요 업무
온디바이스 및 엣지 배포를 위한 실리콘 플랫폼(GPU, NPU, 가속기) 평가 및 선택, 연구팀과 협력하여 실제 배포 제약 조건(지연시간, 메모리, 전력 등)을 충족하는 모델 아키텍처 공동 설계, 시스템 성능 분석 및 모델 설계·하드웨어 역량 간의 트레이드오프 식별, 하드웨어 벤더 및 내부 인프라 팀과 협력하여 새로운 가속기 도입 및 트랜스포머 워크로드 실행 최적화, 커널 개발 및 런타임 시스템을 포함한 저수준 추론 스택 개발 팀 구축 및 리딩.
자격 요건
GPU, NPU 또는 기타 전용 가속기에서 워크로드를 평가하거나 배포한 경험, 트랜스포머 모델의 성능 특성(Attention, KV-cache 동작, 메모리 대역폭 요구사항 등)에 대한 이해, 추론 엔진·분산 런타임·하드웨어 인식 ML 파이프라인 등 고성능 컴퓨팅 시스템 설계 및 최적화 경험, CUDA 커널·컴파일러·ML 런타임 등 저수준 성능 크리티컬 소프트웨어 개발 및 팀 리딩 경험, 모델 학습 및 인지 관련 실무 경험.
기술 스택
GPUNPUCUDATransformerKV-cacheML RuntimesCompilersKernelsInference Engines
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원B2B Marketing Lead, Korea
마케팅Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Context Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&D