Jobs
zoom 로고

zoom

AI Software Engineer

개발AI·머신러닝인프라·DevOps연구·R&D

AI 요약

Zoom의 AI Infra 팀에서 LLM, ASR, VLM 등 다양한 AI 서비스의 추론 인프라를 설계하고 최적화할 AI 소프트웨어 엔지니어를 채용합니다. GPU 레벨의 최적화와 확장 가능한 인프라 구축을 통해 전 세계 수백만 사용자에게 고성능 AI 경험을 제공하는 역할을 수행합니다.

주요 업무

LLM, ASR, MT 시스템용 AI 런타임 개발 및 최적화, CUDA 기반 커널 퓨전 및 메모리 최적화, TorchCompile/그래프 최적화/KV 캐시/연속 배칭 등 추론 최적화 구현, 엔터프라이즈급 AI 워크로드를 위한 확장 가능한 인프라 서비스 구축, 에지 디바이스 및 클라우드 배포용 모델 최적화, 서빙 파이프라인의 지연 시간 및 처리량 개선, 최신 산업 모델의 신속한 통합 및 최적화.

자격 요건

실무 환경에서의 확장 가능하고 신뢰할 수 있는 AI 인프라 구축 경험, GPU 프로그래밍 및 최적화(CUDA, 커널 레벨 개발) 전문성, Transformer 기반 모델 및 추론 프레임워크(vLLM, TensorRT-LLM, SGLang, ONNX Runtime) 숙련도, Python 및 C++ 능통(Java 우대), PyTorch(TorchCompile, 그래프 최적화) 또는 TensorFlow 경험, 저수준 하드웨어 개념(GPU 메모리 계층, 캐싱, 벡터화) 이해, 클라우드 플랫폼(AWS, GCP, Azure) 및 AI 배포 도구(Docker, Kubernetes, MLflow) 익숙함.

기술 스택

PythonC++JavaCUDAPyTorchTensorFlowvLLMTensorRT-LLMSGLangONNX RuntimeTorchCompileAWSGCPAzureDockerKubernetesMLflow
AI 점수 98core

zoom의 다른 공고

알림

알림이 없습니다