openai

Software Engineer, Inference – AMD GPU Enablement

개발AI·머신러닝인프라·DevOps하드웨어·임베디드

AI 요약

OpenAI의 추론(Inference) 팀에서 AMD GPU 플랫폼을 기반으로 AI 모델 추론 인프라를 최적화하고 확장할 엔지니어를 채용합니다. 커널 수준의 성능 최적화부터 대규모 분산 실행까지 담당하며, 최신 AI 모델이 다양한 하드웨어에서 효율적으로 작동하도록 핵심 시스템을 구축하는 역할입니다.

주요 업무

AMD 하드웨어 기반 OpenAI 추론 스택 구축 및 성능 최적화, vLLM/Triton 등 모델 서빙 인프라 통합, 메모리/네트워크/컴퓨팅 레이어 전반의 분산 추론 워크로드 디버깅 및 최적화, 대규모 GPU 클러스터 내 모델 실행의 정확성 및 확장성 검증, HIP/Triton 기반 고성능 GPU 커널 설계 및 최적화 협업, RCCL 등 집합 통신 라이브러리 구축 및 튜닝.

자격 요건

HIP, CUDA, Triton을 이용한 GPU 커널 작성 또는 포팅 경험, 저수준 성능 최적화 역량, NCCL/RCCL 등 통신 라이브러리 및 고처리량 모델 서빙에 대한 이해, 분산 추론 시스템 구축 및 가속기 확장 경험, 하드웨어/시스템/오케스트레이션 전반의 성능 최적화 역량. (우대사항) RCCL, Triton, vLLM 등 오픈소스 라이브러리 기여 경험, GPU 성능 분석 도구(Nsight, rocprof, perf) 숙련, 비 NVIDIA GPU 환경 배포 경험, 모델/텐서 병렬화 및 10B+ 파라미터 모델 서빙 지식.

기술 스택

GPUAMDHIPCUDATritonvLLMRCCLNCCLNsightrocprofperfDistributed Systems

AI 점수 98core

지원하기

Software Engineer, Inference – AMD GPU Enablement

AI 요약

주요 업무

자격 요건

기술 스택

openai의 다른 공고

알림