openai

Software Engineer, Model Inference

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

OpenAI의 Inference 팀에서 대규모 AI 모델을 고성능, 저지연 생산 환경에 맞게 최적화할 엔지니어를 채용합니다. ML 연구원과 협력하여 최신 기술을 제품화하고, GPU 및 분산 시스템 자원을 극대화하여 추론 스택의 효율성을 높이는 역할을 수행합니다.

주요 업무

ML 연구원 및 엔지니어와 협력하여 최신 AI 기술을 제품화, 모델 추론 스택의 성능·지연시간·처리량·효율성 개선을 위한 새로운 기술 및 아키텍처 도입, 시스템 병목 현상 및 불안정성 파악을 위한 도구 구축 및 솔루션 설계, Azure VM 및 GPU 하드웨어 자원(FLOPs, RAM) 활용 최적화, 연구 가속화를 위한 엔지니어링 지원.

자격 요건

5년 이상의 전문 소프트웨어 엔지니어링 경험, 현대적 ML 아키텍처 및 추론 최적화에 대한 깊은 이해, PyTorch 및 NVIDIA GPU 소프트웨어 스택(NCCL, CUDA) 숙련도 또는 빠른 습득 능력, HPC 기술(InfiniBand, MPI, NVLink 등) 지식, 분산 시스템 설계·구축·디버깅 경험, 대규모 시스템 리팩토링 경험 우대, 자기 주도적 문제 해결 능력 및 협업 마인드.

기술 스택

PyTorchNVIDIA GPUsNCCLCUDAInfiniBandMPINVLinkAzure VMsDistributed Systems

AI 점수 100core

지원하기

Software Engineer, Model Inference

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림