
openai
Software Engineer, Inference - Multi Modal
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
OpenAI의 Inference 팀에서 GPT, Whisper 등 최첨단 모델의 대규모 배포를 담당할 소프트웨어 엔지니어를 채용합니다. 특히 이미지, 오디오 등 멀티모달 모델을 위한 고성능 추론 인프라를 설계하고 GPU 최적화를 통해 연구 성과를 실제 서비스로 연결하는 역할을 수행합니다.
주요 업무
대규모 멀티모달 모델을 위한 추론 인프라 설계 및 구현, 이미지 및 오디오 입출력의 고처리량·저지연 전달을 위한 시스템 최적화, 실험적인 연구 워크로드를 신뢰할 수 있는 프로덕션 서비스로 전환, GPU 활용도·텐서 병렬화·하드웨어 추상화 계층(HAL) 등 시스템 레벨 개선 기여, 연구원 및 제품 엔지니어와의 긴밀한 협업.
자격 요건
LLM 또는 멀티모달 모델의 추론 시스템 구축 및 확장 경험, GPU 기반 ML 워크로드 및 대규모 모델의 성능 동역학(이미지/오디오 등 복잡한 데이터 포함) 이해, 네트워킹·분산 컴퓨팅·고처리량 데이터 처리를 아우르는 시스템 숙련도, vLLM, TensorRT-LLM 또는 커스텀 모델 병렬 시스템 등 추론 도구 활용 능력. (우대사항) 이미지 생성 또는 오디오 합성 모델의 프로덕션 서비스 경험, 분산 ML 학습 또는 시스템 효율적 모델 설계 경험.
기술 스택
LLMMultimodal ModelsGPUvLLMTensorRT-LLMTensor ParallelismDistributed ComputeImage GenerationAudio Synthesis
openai의 다른 공고
Workforce Program Manager, Global Affairs
경영지원Agent Post-Training, API & Power Users
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Computer Use Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Personality
AI·머신러닝, 연구·R&DAgent Post-Training, Connectors Research
AI·머신러닝, 연구·R&D, 개발Agent Post-Training, Frontier Evals and Environments Research
연구·R&D, AI·머신러닝, 개발Agent Post-Training, Artifacts Research
AI·머신러닝, 연구·R&DB2B Marketing Lead, Korea
마케팅