
openai
Software Engineer, Model Inference
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
OpenAI의 Inference 팀에서 대규모 AI 모델을 고성능, 저지연 생산 환경에 맞게 최적화할 엔지니어를 채용합니다. ML 연구원과 협력하여 최신 기술을 제품화하고, GPU 및 분산 시스템 자원을 극대화하여 추론 스택의 효율성을 높이는 역할을 수행합니다.
주요 업무
ML 연구원 및 엔지니어와 협력하여 최신 AI 기술을 제품화, 모델 추론 스택의 성능·지연시간·처리량·효율성 개선을 위한 새로운 기술 및 아키텍처 도입, 시스템 병목 현상 및 불안정성 파악을 위한 도구 구축 및 솔루션 설계, Azure VM 및 GPU 하드웨어 자원(FLOPs, RAM) 활용 최적화, 연구 가속화를 위한 엔지니어링 지원.
자격 요건
5년 이상의 전문 소프트웨어 엔지니어링 경험, 현대적 ML 아키텍처 및 추론 최적화에 대한 깊은 이해, PyTorch 및 NVIDIA GPU 소프트웨어 스택(NCCL, CUDA) 숙련도 또는 빠른 습득 능력, HPC 기술(InfiniBand, MPI, NVLink 등) 지식, 분산 시스템 설계·구축·디버깅 경험, 대규모 시스템 리팩토링 경험 우대, 자기 주도적 문제 해결 능력 및 협업 마인드.
기술 스택
PyTorchNVIDIA GPUsNCCLCUDAInfiniBandMPINVLinkAzure VMsDistributed Systems
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅