openai

Software Engineer, Inference - Multi Modal

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

OpenAI의 Inference 팀에서 GPT, Whisper 등 최첨단 모델의 대규모 배포를 담당할 소프트웨어 엔지니어를 채용합니다. 특히 이미지, 오디오 등 멀티모달 모델을 위한 고성능 추론 인프라를 설계하고 GPU 최적화를 통해 연구 성과를 실제 서비스로 연결하는 역할을 수행합니다.

주요 업무

대규모 멀티모달 모델을 위한 추론 인프라 설계 및 구현, 이미지 및 오디오 입출력의 고처리량·저지연 전달을 위한 시스템 최적화, 실험적인 연구 워크로드를 신뢰할 수 있는 프로덕션 서비스로 전환, GPU 활용도·텐서 병렬화·하드웨어 추상화 계층(HAL) 등 시스템 레벨 개선 기여, 연구원 및 제품 엔지니어와의 긴밀한 협업.

자격 요건

LLM 또는 멀티모달 모델의 추론 시스템 구축 및 확장 경험, GPU 기반 ML 워크로드 및 대규모 모델의 성능 동역학(이미지/오디오 등 복잡한 데이터 포함) 이해, 네트워킹·분산 컴퓨팅·고처리량 데이터 처리를 아우르는 시스템 숙련도, vLLM, TensorRT-LLM 또는 커스텀 모델 병렬 시스템 등 추론 도구 활용 능력. (우대사항) 이미지 생성 또는 오디오 합성 모델의 프로덕션 서비스 경험, 분산 ML 학습 또는 시스템 효율적 모델 설계 경험.

기술 스택

LLMMultimodal ModelsGPUvLLMTensorRT-LLMTensor ParallelismDistributed ComputeImage GenerationAudio Synthesis

AI 점수 100core

지원하기

Software Engineer, Inference - Multi Modal

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림