
zoom
AI Software Engineer
개발AI·머신러닝인프라·DevOps연구·R&D
AI 요약
Zoom의 AI Infra 팀에서 LLM, ASR, VLM 등 다양한 AI 서비스의 추론 인프라를 설계하고 최적화할 AI 소프트웨어 엔지니어를 채용합니다. GPU 레벨의 최적화와 확장 가능한 인프라 구축을 통해 전 세계 수백만 사용자에게 고성능 AI 경험을 제공하는 역할을 수행합니다.
주요 업무
LLM, ASR, MT 시스템용 AI 런타임 개발 및 최적화, CUDA 기반 커널 퓨전 및 메모리 최적화, TorchCompile/그래프 최적화/KV 캐시/연속 배칭 등 추론 최적화 구현, 엔터프라이즈급 AI 워크로드를 위한 확장 가능한 인프라 서비스 구축, 에지 디바이스 및 클라우드 배포용 모델 최적화, 서빙 파이프라인의 지연 시간 및 처리량 개선, 최신 산업 모델의 신속한 통합 및 최적화.
자격 요건
실무 환경에서의 확장 가능하고 신뢰할 수 있는 AI 인프라 구축 경험, GPU 프로그래밍 및 최적화(CUDA, 커널 레벨 개발) 전문성, Transformer 기반 모델 및 추론 프레임워크(vLLM, TensorRT-LLM, SGLang, ONNX Runtime) 숙련도, Python 및 C++ 능통(Java 우대), PyTorch(TorchCompile, 그래프 최적화) 또는 TensorFlow 경험, 저수준 하드웨어 개념(GPU 메모리 계층, 캐싱, 벡터화) 이해, 클라우드 플랫폼(AWS, GCP, Azure) 및 AI 배포 도구(Docker, Kubernetes, MLflow) 익숙함.
기술 스택
PythonC++JavaCUDAPyTorchTensorFlowvLLMTensorRT-LLMSGLangONNX RuntimeTorchCompileAWSGCPAzureDockerKubernetesMLflow
zoom의 다른 공고
Director, Strategic Sourcing & Category Strategy: Enterprise Technology
경영지원Executive Assistant
경영지원DevOps Engineer
인프라·DevOpsChannel Account Manager - KSA
영업AI Engineer
개발, AI·머신러닝, 인프라·DevOpsResearch Scientist - AI Incubation
AI·머신러닝, 연구·R&DWorkplace Operations Lead
경영지원, 현장운영Data Engineer, People Analytics
데이터, 인프라·DevOps